Cách hợp nhất nhiều workbook Excel bằng Python – Kách Hay .Com đã tổng hợp thông tin từ nhiều nguồn, giúp bạn có góc nhìn đa chiều hơn. Nào chúng ta bắt đầu thôi
Ứng dụng Công nghệ Tin học văn phòng Microsoft Excel
Cách hợp nhất nhiều sổ làm việc Excel bằng Python
Hà Nguyên
Python là một ngôn ngữ có giá trị vượt trội, đặc biệt nếu bạn muốn làm việc với dữ liệu có cấu trúc. Vì mọi người lưu trữ nhiều dữ liệu trong các tệp Excel, nên bắt buộc phải hợp nhất nhiều tệp để tiết kiệm thời gian và công sức.
Python cho phép bạn làm điều này. Cho dù bạn muốn kết hợp bao nhiêu tệp Excel, bạn có thể thực hiện điều đó một cách dễ dàng. Trong hướng dẫn này, bạn cần cài đặt và sử dụng thư viện pandas để nhập dữ liệu vào Python trước khi hợp nhất chúng.
Cài đặt thư viện gấu trúc trong Python
Pandas là thư viện của bên thứ ba mà bạn có thể cài đặt bằng Python. Một số IDE đã cài đặt gấu trúc.
Nếu bạn đang sử dụng phiên bản IDE không được cài đặt sẵn pandas, hãy yên tâm rằng bạn có thể cài đặt trực tiếp với Python.
Để cài đặt gấu trúc:
pip cài đặt gấu trúc
Nếu bạn đang sử dụng Jupyter Notebook, bạn có thể cài đặt Pandas trực tiếp bằng lệnh PIP. Nếu bạn đã cài đặt Jupyter với Anaconda, rất có thể bạn đã có thể sử dụng pandas ngay lập tức trong hầu hết các trường hợp.
Nếu bạn không thể làm cho gấu trúc hoạt động, bạn có thể cài đặt chúng trực tiếp bằng lệnh trên.
Kết hợp các tệp Excel với Python
Trước tiên, bạn cần tạo một thư mục chứa tất cả các tệp Excel ở vị trí ưa thích của mình. Khi thư mục đã sẵn sàng, bạn có thể bắt đầu viết mã để nhập các thư viện.
Trong mã này, bạn sử dụng hai biến:
- Pandas : Thư viện Pandas cung cấp các khung dữ liệu để lưu trữ các tệp Excel.
- Hệ điều hành : Một thư viện hữu ích để đọc dữ liệu từ một thư mục trên máy tính của bạn
Để nhập các thư viện này, hãy sử dụng các lệnh sau:
Nhập Pandas dưới dạng pd Nhập hệ điều hành
- Nhập : Cú pháp Python để nhập thư viện vào Python
- Pandas : tên thư viện
- pd : bí danh được cấp cho thư viện
- Hệ điều hành : Một thư viện để truy cập các thư mục hệ thống
Sau khi nhập các thư viện, hãy tạo hai biến để lưu trữ đường dẫn tệp đầu vào và đầu ra. Đường dẫn tệp đầu vào là cần thiết để truy cập thư mục của tệp. Đường dẫn tệp đầu ra là bắt buộc vì đó là nơi tệp kết hợp sẽ được xuất ra.
Nếu bạn đang sử dụng Python, hãy đảm bảo rằng bạn thay đổi dấu gạch chéo ngược thành dấu gạch chéo ngược ( \ thành / ).
input_file_path = “C:/Users/gaurav/OneDrive/Desktop/Excel files/” output_file_path = “C:/Users/gaurav/OneDrive/Desktop/”
Cũng nối / vào cuối để hoàn thành các đường dẫn.
Các tập tin của thư mục có sẵn trong một danh sách. Tạo một danh sách để lưu trữ tất cả các tham chiếu tệp của thư mục đầu vào bằng hàm listdir từ thư viện hệ điều hành.
Nếu không rõ trong thư viện có những hàm nào, bạn có thể sử dụng hàm dir với tên thư viện. Ví dụ: để kiểm tra phiên bản chính xác của hàm listdir, bạn có thể sử dụng lệnh sau:
bạn (hệ điều hành)
Đầu ra bao gồm tất cả các chức năng liên quan có sẵn trong thư viện hệ điều hành. Hàm listdir là một trong nhiều hàm có sẵn trong thư viện này.
Tạo một biến mới để lưu trữ các tệp đầu vào từ thư mục.
excel_file_list = os.listdir(input_file_path)
Trả về biến này để hiển thị tên của các tệp được lưu trữ trong thư mục. Tất cả các tệp được lưu trữ trong thư mục được hiển thị khi bạn sử dụng chức năng in.
in (excel_file_list)
Tiếp theo, bạn cần thêm một khung dữ liệu mới để lưu trữ từng tệp Excel. Hãy coi khung dữ liệu như một thùng chứa để lưu trữ dữ liệu. Đây là lệnh để tạo khung dữ liệu.
df = pd.DataFrame()
- df : biến để lưu trữ giá trị của DataFrame
- pd : bí danh cho pandas .library
- DataFrame : Cú pháp chuẩn để thêm khung dữ liệu
Trong ví dụ này, thư mục đầu vào chứa 3 tệp .xlsx. Tên tệp là:
Tệp1_excel.xlsx Tệp2_excel.xlsx Tệp3_excel.xlsx
Để mở mọi tệp từ thư mục này, bạn phải lặp lại. Vòng lặp sẽ chạy cho từng tệp trong danh sách được tạo ở trên.
Đây là cách bạn có thể làm điều đó:
cho excel_files trong excel_file_list:
Tiếp theo, bạn cần kiểm tra phần mở rộng của tệp vì mã sẽ chỉ mở tệp XLSX. Để kiểm tra các tệp này, bạn có thể sử dụng câu lệnh if.
Để thực hiện việc này, hãy sử dụng hàm endwith như sau:
cho excel_files trong excel_file_list: nếu excel_files.endswith(“.xlsx”):
- excel_files : danh sách với tất cả các giá trị tệp
- endwith : Chức năng kiểm tra phần mở rộng tập tin
- (“.xlsx”) : Chuỗi giá trị này có thể thay đổi, tùy thuộc vào những gì bạn muốn tìm kiếm
Bây giờ, sau khi đã xác định được các tệp Excel, bạn có thể tạo một khung dữ liệu mới để đọc và lưu trữ các tệp riêng lẻ.
cho excel_files trong excel_file_list: if excel_files.endswith(“.xlsx”): df1 = pd.read_excel(input_file_path+excel_files)
- df1: Khung dữ liệu mới
- pd: Thư viện Pandas
- read_excel: Hàm đọc các tệp Excel trong thư viện Pandas
- input_file_path: Đường dẫn của thư mục nơi các tệp được lưu trữ
- excel_files: Bất kỳ biến nào được sử dụng trong vòng lặp for
Để bắt đầu nối các tệp, bạn có thể cần sử dụng hàm append.
cho excel_files trong excel_file_list: if excel_files.endswith(“.xlsx”): df1 = pd.read_excel(input_file_path+excel_files) df = df.append(df1)
Cuối cùng, bây giờ khung dữ liệu tổng hợp đã sẵn sàng, bạn có thể xuất nó sang vị trí đầu ra. Trong trường hợp này, bạn đang xuất filetSX.
df.to_excel(output_file_path+”Consolidated_file.xlsx”)
- df: Khung dữ liệu sẽ được xuất
- to_excel: lệnh xuất dữ liệu
- output_file_path: Đường dẫn được chỉ định để lưu đầu ra
- Merge_file.xlsx: tên file đã gộp
Bây giờ hãy nhìn vào mã cuối cùng:
#Pandas được sử dụng làm khung dữ liệu để xử lý các tệp Excel nhập pandas dưới dạng pd import os # thay đổi dấu gạch chéo từ “\” thành “/”, nếu bạn đang sử dụng thiết bị Windows input_file_path = “C:/Users/gaurav/OneDrive/Desktop/ Tệp Excel/” output_file_path = “C:/Users/gaurav/OneDrive/Desktop/” #tạo danh sách để lưu trữ tất cả tham chiếu tệp của thư mục đầu vào bằng hàm listdir từ thư viện os. #Để xem nội dung của thư viện (như hàm listdir, bạn có thể sử dụng hàm dir trên tên thư viện). #Sử dụng dir(library_name) để liệt kê nội dung excel_file_list = os.listdir(input_file_path) #in tất cả các tệp được lưu trữ trong thư mục, sau khi xác định danh sách excel_file_list #Sau khi mỗi tệp mở ra, hãy sử dụng chức năng nối thêm để bắt đầu hợp nhất dữ liệu được lưu trữ trong nhiều tệp các tệp #tạo một khung dữ liệu mới, trống,
Python’s Pandas ist ein großartiges Tool für Anfänger und Fortgeschrittene. Die Bibliothek wird häufig von Entwicklern verwendet, die Python beherrschen möchten.
Auch als Anfänger können Sie enorm davon profitieren, wenn Sie die Nuancen von Pandas lernen und wie die Bibliothek in Python verwendet wird.
- Cách xem Workbook Statistics trong Excel
- Cách nhập dữ liệu Excel vào tập lệnh Python bằng Pandas
- Hướng dẫn cách tự động mở một Workbook khi mở Excel
Thứ Bảy, 26/03/2022 09:20
3 ★ 1 👨 1.999
0 Bình luận
Sắp xếp theo Mặc định Mới nhất Cũ nhất
😀 😃 😄 😁 😆 😅 😂 🤣 😊 😇 🙂 🙃 😉 😌 😍 🥰 😘 😗 😙 😚 😋 😛 😝 😜 🤪 🤨 🧐 🤓 😎 🤩 🥳 😏 😒 😞 😔 😟 😕 🙁 😣 😖 😫 😩 🥺 😢 😭 😤 😠 😡 🤬 🤯 😳 🥵 🥶 😱 😨 😰 😥 😓 🤗 🤔 🤭 🥱 🤫 🤥 😶 😐 😑 😬 🙄 😯 😦 😧 😮 😲 😴 🤤 😪 😵 🤐 🥴 🤢 🤮 🤧 😷 🤒 🤕 🤑 🤠 😈 👿 👹 👺 🤡 💩 👻 💀 👽 👾 🤖 🎃 😺 😸 😹 😻 😼 😽 🙀 😿 😾 🤲 👐 🙌 👏 🤝 👍 👎 👊 ✊ 🤛 🤜 🤞 ✌ 🤟 🤘 👌 🤏 👈 👉 👆 👇 ☝ ✋ 🤚 🖐 🖖 👋 🤙 💪 🦾 🖕 ✍ 🙏 🦶 🦵 🦿 💄 💋 👄 🦷 🦴 👅 👂 🦻 👃 👣 👀 🧠 🗣 👤 👥 👶 👧 🧒 👦 👩 🧑 👨 👱 🧔 👵 🧓 👴 👲 👳 🧕 👮 👷 💂 🕵 👰 🤵 👸 🤴 🦸 🦹 🤶 🎅 🧙 🧝 🧛 🧟 🧞 🧜 🧚 👼 🤰 🤱 🙇 💁 🙅 🙆 🙋 🧏 🤦 🤷 🙎 🙍 💇 💆 🧖 💅 🤳 💃 🕺 👯 🕴 🚶 🏃 🧍 🧎 👫 👭 👬 💑 💏 👪
Xóa Đăng nhập để Gửi
Bạn nên đọc
Microsoft giới thiệu cảm biến Kinect thế hệ thứ 2 cho Windows
Cách dùng chế độ chia cửa sổ trong Windows 8
Cấu hình iPhone 5S lộ diện trước giờ ra mắt
Ban know what about the software technology P2
Idea Center B320 – máy tính tất cả trong một bảo vệ mắt
Khám phá PC case liền màn hình ‘hot’ nhất trên thị trường
Microsoft Excel
Cách sử dụng Slicer filter data Excel
Lệnh sửa lỗi Copy Paste không hoạt động trên Word, Excel (2007, 2010)
4 Chức năng PivotTable nâng cao để phân tích dữ liệu Excel
Các kỹ năng yêu cầu khi thi MOS Excel
Cách chuyển Excel sang XML
Cách vẽ biểu đồ cột trong Excel
Cách tạo khoảng cách sau deu com trong Excel
Hướng dẫn chèn PDF vào Excel
Tải xuống Trình xem Microsoft Excel 12.0.6611.1000
Xem thêm
Tin học Văn phòng
Phần mềm soạn thảo văn bản
Microsoft Excel
Microsoft Powerpoint
truy cập Microsoft
Google Tài liệu
Google Trang tính
Google Trang trình bày
Tài liệu PDF
Ứng dụng khác
Email thủ thuật