Excel CSV UTF8 - Bước dễ dàng để chuyển đổi tệp Excel thành CSV UTF8

Mục lục

Excel sang CSV UTF8

Trong trường hợp excel chứa bất kỳ dấu ngoặc kép thông minh nào hoặc bất kỳ dữ liệu ngôn ngữ nào khác trong khi chuyển đổi dữ liệu từ Excel sang CSV, nó sẽ không chuyển đổi chính xác và nhận được dấu chấm hỏi. Vì vậy, trong khi nhập dữ liệu, chúng tôi cũng nhận được những thứ tương tự. Tuy nhiên, bằng cách sử dụng Excel CSV UTF8 làm mã hóa, chúng tôi có thể chọn định dạng tệp và ngôn ngữ dễ dàng.

Mã hóa UTF8 là gì?

U nicode T ransformation F ormat là định dạng chuyển đổi bất kỳ ký tự nào sang chuẩn Unicode có thể nhỏ gọn như ASCII.

ASCII: Mã tiêu chuẩn Hoa Kỳ để trao đổi thông tin

Các tệp định dạng CSV đã tồn tại trong nhiều năm và tất cả những gì chúng ta biết chỉ là mức cơ bản để xuất và nhập dữ liệu. Nhưng thêm vào đó, có một số kỹ thuật tiên tiến cũng ở đó. Trong trường hợp dữ liệu đi kèm với các ký tự đặc biệt, cần một loại quy trình khác để chuyển đổi dữ liệu từ Excel sang CSV. Trong bài viết này, chúng tôi sẽ hướng dẫn bạn cách xử lý các loại ký tự đặc biệt với tệp CSV excel, tức là CSV UTF8.

Ví dụ về mã hóa UTF8 trong tệp Excel CSV

Ví dụ, hãy xem dữ liệu dưới đây trong trang tính excel.

Đây là những cái tên bằng tiếng Nhật và chúng ta có nghĩa tiếng Anh thích hợp cho từng từ ở đây. Bây giờ chúng ta hãy chuyển đổi tệp sang định dạng CSV ngay bây giờ.

Bước 1: Nhấn nút Save As hoặc nhấn phím tắt F12 trong excel.

Bước 2: Chọn thư mục đích để lưu tệp dưới dạng tệp CSV.

Bước 3: Thay đổi loại tệp lưu dưới dạng thành CSV (Phân cách bằng dấu phẩy).

Bước 4: Nhấp vào nút “Lưu” và dữ liệu của chúng tôi sẽ được lưu dưới dạng tệp CSV.

Với phần mở rộng tệp, chúng ta có thể dễ dàng xem định dạng tệp.

Nhìn vào các tệp ở trên, chúng được đặt tên giống nhau, nhưng phần mở rộng tệp là “CSV” & “XLSM”, vì vậy điều này cho thấy rằng cả hai định dạng tệp đều khác nhau.

Bây giờ hãy mở tệp CSV và xem những gì chúng tôi nhận được.

Nhìn vào các giá trị trong cột B & C (nơi chúng ta có các từ tiếng Nhật), chúng ta có dấu chấm hỏi thay vì các từ thực tế và khi chúng ta thử nhập dữ liệu vào excel, chúng ta vẫn chỉ nhận được dấu chấm hỏi.

Vì vậy, đây là vấn đề với việc chuyển đổi dữ liệu ký tự đặc biệt sang tệp CSV. Để tránh điều này, chúng ta cần tuân theo các quy trình khác nhau và quy trình dưới đây.

Lưu tệp dưới dạng định dạng văn bản Unicode

Trước khi lưu dữ liệu ở định dạng tệp CSV, trước tiên chúng ta cần lưu dưới dạng “Văn bản Unicode (* .txt)”, sau đó chuyển đổi sang tệp CSV, hãy làm theo các bước dưới đây.

Bước 1: Một lần nữa, mở cửa sổ Save As, và lần này, chọn định dạng tệp là định dạng “Unicode Text (* .Txt)”.

Bước 2: Nhấp vào nút “Lưu” và tệp sẽ được lưu ở định dạng Unicode.

Nhìn ngay bây giờ; chúng tôi có ba tệp định dạng, Excel, CSV & Định dạng văn bản Unicode.

Bây giờ, hãy mở tệp Văn bản Unicode và xem dữ liệu trông như thế nào.

Dữ liệu giống như trong tệp văn bản.

Bây giờ chúng ta cần lưu tệp trên dưới dạng mã hóa của phương thức UTF-8 để lấy dữ liệu chính xác vào excel. Vì vậy, bây giờ, hãy chèn dấu phân cách cho dữ liệu trên bằng cách thay thế các ký tự khoảng trắng. Sao chép ký tự khoảng trắng đầu tiên.

Bây giờ, hãy mở Tìm & Thay thế trong Excel và thay thế khoảng trống đã sao chép bằng dấu phẩy (,).

Nhấp vào Replace All và tất cả các ký tự khoảng trắng sẽ được thay thế bằng dấu phẩy.

Bây giờ chọn tùy chọn Save As.

Thao tác này sẽ mở ra cửa sổ lưu và trong cửa sổ đó, hãy chọn tùy chọn Mã hóaUTF-8.

Nhấp vào nút “Lưu” để hoàn thành tùy chọn lưu.

Bây giờ hãy thay đổi phần mở rộng tệp từ “.txt” thành “.csv.”

Bây giờ hãy mở tệp CSV và chúng ta sẽ nhận được các từ tiếng Nhật chính xác thay vì dấu hỏi.

Những điều cần ghi nhớ

  • UTF chuyển đổi các từ ký tự đặc biệt thông qua mã hóa.
  • Lưu tệp dưới dạng Unicode trước khi chuyển đổi sang CSV và mã hóa dưới dạng UTF-8.

thú vị bài viết...