Làm cách nào để trích xuất văn bản cụ thể từ excel?

Đôi khi, dữ liệu của bạn có nhiều thông tin trong một cột. Giống như một cột với U. S. tiểu bang ở định dạng US-TX. Hoặc một cột có các công ty và sản phẩm họ bán. Datawrapper [Software]

Nhưng giả sử bạn muốn tách quốc gia [US] khỏi tiểu bang [TX] — ví dụ: để tạo bản đồ choropleth Datawrapper. Điều tốt là có nhiều cách dễ dàng để tách các điểm dữ liệu thành hai hoặc nhiều cột

Tôi sẽ chỉ ra hai cách để tạo nhiều cột mới từ một cột cũ. Chúng tôi sẽ sử dụng Google Trang tính — nhưng các thủ thuật tương tự sẽ hoạt động với LibreOffice Calc, Excel hoặc bất kỳ phần mềm bảng tính nào khác

Phương pháp đầu tiên là công thức =SPLIT[]

Chia cột bằng SPLIT[]

  1. Tạo ít nhất hai cột mới bên cạnh cột có dữ liệu bạn muốn tách. Để làm như vậy, hãy nhấp vào tiêu đề [AB
    FIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
    
    0, v.v. ]. Sau đó nhấp vào hình tam giác nhỏ và chọn “Insert 1 right. ” Lặp lại để tạo cột trống thứ hai
  2. Trong cột trống đầu tiên, hãy viết 
    FIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
    
    1, với 
    FIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
    
    2 là ô bạn muốn tách và Datawrapper [Software]0 ký tự bạn muốn tách ô. [Nếu thấy lỗi Datawrapper [Software]1 trong ô của mình, bạn sẽ cần tạo thêm các cột. ]
  3. Để áp dụng các thay đổi cho các ô bên dưới, hãy kéo xuống hình vuông màu xanh lam ở dưới cùng bên phải của [các] ô đã chọn. Nhấp đúp vào ô vuông màu xanh để điền vào tất cả các ô còn lại

Trích xuất nội dung từ các cột bằng LEFT[]

Đôi khi bạn không có các ký tự ngăn cách rõ ràng mà chỉ muốn tách ký tự đầu hoặc cuối của một ô. Để làm như vậy, hãy sử dụng các công thức Datawrapper [Software]2, Datawrapper [Software]3, và Datawrapper [Software]4

  1. Chèn một cột mới. [Hoặc hai. Hoặc ba. Nhiều như bạn cần. ]
  2. Trong [các] cột mới, viết
    Datawrapper [Software]2 để trích xuất 2 ký tự đầu tiên của ô B1.
    ______43 để trích xuất 8 ký tự cuối của ô B1.
    ______47 để trích xuất 2 ký tự sau ký tự thứ 4 trong B1.
  3. Để áp dụng các thay đổi cho các ô bên dưới, hãy kéo hình vuông màu xanh lam xuống

mẹo chuyên nghiệp

mẹo chuyên nghiệp 1. Bạn có thể kết hợp các công thức để trích xuất các ký tự ở tất cả các vị trí điên rồ. Ví dụ: công thức Datawrapper [Software]8 trả về số lượng ký tự trong một ô. Vì vậy, Datawrapper [Software]9 trích xuất toàn bộ văn bản trong một ô ngoại trừ hai ký tự cuối cùng. Để tách ô Datawrapper [Software] thành hai ô US1 và US2, bạn có thể sử dụng công thức US3. Trước tiên, công thức này sẽ xóa dấu ngoặc cuối cùng, sau đó tách nội dung ô còn lại trên US4

mẹo chuyên nghiệp 2. Bây giờ bạn đã học cách tách văn bản, bạn cũng có thể tập hợp lại văn bản. Để kết hợp cột US từ ô A1 và TX từ B1 bằng dấu gạch nối, hãy sử dụng dấu và và viết US7

mẹo chuyên nghiệp 3. Bạn có thể trích xuất nội dung bằng US8, US9, và TX0 không chỉ từ các ô văn bản mà còn từ các ô số và ngày tháng. Nếu bạn muốn áp dụng các công thức như US8 cho ngày của mình, trước tiên, bạn nên chuyển đổi chúng thành định dạng văn bản. Để làm như vậy, hãy sử dụng công thức TX2. Thay vì TX3, bạn có thể sử dụng bất kỳ tổ hợp nào của các mã ngày này và TX4, Datawrapper [Software]0, dấu cách, v.v. Ví dụ: TX6 sẽ chuyển đổi định dạng ngày tháng TX7 thành ô văn bản có nội dung TX8

mẹo chuyên nghiệp 4. Nếu bạn có các ô trống trong cột của mình và bạn muốn chúng vẫn trống sau khi sử dụng một hàm như US8, trước tiên bạn cần kiểm tra các ô trống này. Bạn có thể làm như vậy với hàm =SPLIT[]0, kết hợp với hàm =SPLIT[]1. =SPLIT[]2

tôi hy vọng nó sẽ có ích. Nếu bạn cần thêm trợ giúp để làm sạch dữ liệu của mình nhằm chuẩn bị cho công cụ lập biểu đồ như Datawrapper, hãy truy cập bài viết của chúng tôi "Cách chuẩn bị dữ liệu của bạn để phân tích và lập biểu đồ trong Excel và Google Trang tính. ” Và nếu bạn có bất kỳ câu hỏi nào, vui lòng để lại nhận xét hoặc viết thư cho tôi tại lisa@datawrapper. de

ý chính. công thức này "làm đầy" khoảng cách giữa các từ trong một chuỗi văn bản có nhiều khoảng trắng, tìm và trích xuất chuỗi con quan tâm, đồng thời sử dụng hàm TRIM để dọn dẹp mớ hỗn độn

Làm việc từ trong ra ngoài, văn bản gốc ở B5 tràn ngập khoảng trắng khi sử dụng SUBSTITUTE

SUBSTITUTE[B5," ",REPT[" ",99]]

Điều này thay thế từng khoảng trắng bằng 99 khoảng trắng

Ghi chú. 99 chỉ là một số tùy ý đại diện cho từ dài nhất bạn cần trích xuất

Tiếp theo, hàm TÌM định vị ký tự cụ thể [trong trường hợp này là "@"] bên trong văn bản bị ngập

FIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50

TÌM trả về vị trí của "@" trong văn bản này, từ đó 50 bị trừ. Trừ 50 một cách hiệu quả "đi lùi" vị trí đến một nơi nào đó ở giữa các khoảng trống trước chuỗi con quan tâm. Trong ví dụ được hiển thị, vị trí được tính toán là 366

Hàm MAX dùng để xử lý vấn đề chuỗi con xuất hiện trước trong văn bản. Trong trường hợp đó, vị trí sẽ âm và MAX được sử dụng để đặt lại thành 1

Với vị trí bắt đầu được thiết lập , MID được sử dụng để trích xuất 99 ký tự của văn bản, bắt đầu từ 366 từ văn bản trong B5, một lần nữa tràn ngập không gian

MID[SUBSTITUTE[B5," ",REPT[" ",99]],366,99]

Điều này trích xuất chuỗi con quan tâm, với rất nhiều ký tự khoảng trắng trước và sau

Cuối cùng, hàm TRIM được sử dụng để cắt khoảng trắng ở đầu và cuối, đồng thời trả về chuỗi con chứa ký tự đặc biệt

Chủ Đề