Đôi khi, dữ liệu của bạn có nhiều thông tin trong một cột. Giống như một cột với U. S. tiểu bang ở định dạng US-TX
. Hoặc một cột có các công ty và sản phẩm họ bán. Datawrapper [Software]
Nhưng giả sử bạn muốn tách quốc gia [US
] khỏi tiểu bang [TX
] — ví dụ: để tạo bản đồ choropleth Datawrapper. Điều tốt là có nhiều cách dễ dàng để tách các điểm dữ liệu thành hai hoặc nhiều cột
Tôi sẽ chỉ ra hai cách để tạo nhiều cột mới từ một cột cũ. Chúng tôi sẽ sử dụng Google Trang tính — nhưng các thủ thuật tương tự sẽ hoạt động với LibreOffice Calc, Excel hoặc bất kỳ phần mềm bảng tính nào khác
Phương pháp đầu tiên là công thức =SPLIT[]
Chia cột bằng SPLIT[]
- Tạo ít nhất hai cột mới bên cạnh cột có dữ liệu bạn muốn tách. Để làm như vậy, hãy nhấp vào tiêu đề [
A
,B
,
0, v.v. ]. Sau đó nhấp vào hình tam giác nhỏ và chọn “Insert 1 right. ” Lặp lại để tạo cột trống thứ haiFIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
- Trong cột trống đầu tiên, hãy viết
1, vớiFIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
2 là ô bạn muốn tách vàFIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
Datawrapper [Software]
0 ký tự bạn muốn tách ô. [Nếu thấy lỗiDatawrapper [Software]
1 trong ô của mình, bạn sẽ cần tạo thêm các cột. ] - Để áp dụng các thay đổi cho các ô bên dưới, hãy kéo xuống hình vuông màu xanh lam ở dưới cùng bên phải của [các] ô đã chọn. Nhấp đúp vào ô vuông màu xanh để điền vào tất cả các ô còn lại
Trích xuất nội dung từ các cột bằng LEFT[]
Đôi khi bạn không có các ký tự ngăn cách rõ ràng mà chỉ muốn tách ký tự đầu hoặc cuối của một ô. Để làm như vậy, hãy sử dụng các công thức Datawrapper [Software]
2, Datawrapper [Software]
3, và Datawrapper [Software]
4
- Chèn một cột mới. [Hoặc hai. Hoặc ba. Nhiều như bạn cần. ]
- Trong [các] cột mới, viết
Datawrapper [Software]
2 để trích xuất 2 ký tự đầu tiên của ô B1.
______43 để trích xuất 8 ký tự cuối của ô B1.
______47 để trích xuất 2 ký tự sau ký tự thứ 4 trong B1. - Để áp dụng các thay đổi cho các ô bên dưới, hãy kéo hình vuông màu xanh lam xuống
mẹo chuyên nghiệp
mẹo chuyên nghiệp 1. Bạn có thể kết hợp các công thức để trích xuất các ký tự ở tất cả các vị trí điên rồ. Ví dụ: công thức Datawrapper [Software]
8 trả về số lượng ký tự trong một ô. Vì vậy, Datawrapper [Software]
9 trích xuất toàn bộ văn bản trong một ô ngoại trừ hai ký tự cuối cùng. Để tách ô Datawrapper [Software]
thành hai ô US
1 và US
2, bạn có thể sử dụng công thức US
3. Trước tiên, công thức này sẽ xóa dấu ngoặc cuối cùng, sau đó tách nội dung ô còn lại trên US
4
mẹo chuyên nghiệp 2. Bây giờ bạn đã học cách tách văn bản, bạn cũng có thể tập hợp lại văn bản. Để kết hợp cột US
từ ô A1 và TX
từ B1 bằng dấu gạch nối, hãy sử dụng dấu và và viết US
7
mẹo chuyên nghiệp 3. Bạn có thể trích xuất nội dung bằng US
8, US
9, và TX
0 không chỉ từ các ô văn bản mà còn từ các ô số và ngày tháng. Nếu bạn muốn áp dụng các công thức như US
8 cho ngày của mình, trước tiên, bạn nên chuyển đổi chúng thành định dạng văn bản. Để làm như vậy, hãy sử dụng công thức TX
2. Thay vì TX
3, bạn có thể sử dụng bất kỳ tổ hợp nào của các mã ngày này và TX
4, Datawrapper [Software]
0, dấu cách, v.v. Ví dụ: TX
6 sẽ chuyển đổi định dạng ngày tháng TX
7 thành ô văn bản có nội dung TX
8
mẹo chuyên nghiệp 4. Nếu bạn có các ô trống trong cột của mình và bạn muốn chúng vẫn trống sau khi sử dụng một hàm như US
8, trước tiên bạn cần kiểm tra các ô trống này. Bạn có thể làm như vậy với hàm =SPLIT[]
0, kết hợp với hàm =SPLIT[]
1. =SPLIT[]
2
tôi hy vọng nó sẽ có ích. Nếu bạn cần thêm trợ giúp để làm sạch dữ liệu của mình nhằm chuẩn bị cho công cụ lập biểu đồ như Datawrapper, hãy truy cập bài viết của chúng tôi "Cách chuẩn bị dữ liệu của bạn để phân tích và lập biểu đồ trong Excel và Google Trang tính. ” Và nếu bạn có bất kỳ câu hỏi nào, vui lòng để lại nhận xét hoặc viết thư cho tôi tại lisa@datawrapper. de
ý chính. công thức này "làm đầy" khoảng cách giữa các từ trong một chuỗi văn bản có nhiều khoảng trắng, tìm và trích xuất chuỗi con quan tâm, đồng thời sử dụng hàm TRIM để dọn dẹp mớ hỗn độn
Làm việc từ trong ra ngoài, văn bản gốc ở B5 tràn ngập khoảng trắng khi sử dụng SUBSTITUTE
SUBSTITUTE[B5," ",REPT[" ",99]]
Điều này thay thế từng khoảng trắng bằng 99 khoảng trắng
Ghi chú. 99 chỉ là một số tùy ý đại diện cho từ dài nhất bạn cần trích xuất
Tiếp theo, hàm TÌM định vị ký tự cụ thể [trong trường hợp này là "@"] bên trong văn bản bị ngập
FIND["@",SUBSTITUTE[B5," ",REPT[" ",99]]]-50
TÌM trả về vị trí của "@" trong văn bản này, từ đó 50 bị trừ. Trừ 50 một cách hiệu quả "đi lùi" vị trí đến một nơi nào đó ở giữa các khoảng trống trước chuỗi con quan tâm. Trong ví dụ được hiển thị, vị trí được tính toán là 366
Hàm MAX dùng để xử lý vấn đề chuỗi con xuất hiện trước trong văn bản. Trong trường hợp đó, vị trí sẽ âm và MAX được sử dụng để đặt lại thành 1
Với vị trí bắt đầu được thiết lập , MID được sử dụng để trích xuất 99 ký tự của văn bản, bắt đầu từ 366 từ văn bản trong B5, một lần nữa tràn ngập không gian
MID[SUBSTITUTE[B5," ",REPT[" ",99]],366,99]
Điều này trích xuất chuỗi con quan tâm, với rất nhiều ký tự khoảng trắng trước và sau
Cuối cùng, hàm TRIM được sử dụng để cắt khoảng trắng ở đầu và cuối, đồng thời trả về chuỗi con chứa ký tự đặc biệt