Hướng dẫn flatmap equivalent in python

You can concatenate lists using the normal addition operator:

>>> [1, 2] + [3, 4]
[1, 2, 3, 4]

The built-in function sum will add the numbers in a sequence and can optionally start from a specific value:

>>> sum[xrange[10], 100]

Combine the above to flatten a list of lists:

>>> sum[[[1, 2], [3, 4]], []]
[1, 2, 3, 4]

You can now define your flatmap:

>>> def flatmap[f, seq]:
...   return sum[[f[s] for s in seq], []]
>>> flatmap[range, [1,2,3]]
[0, 0, 1, 0, 1, 2]

Edit: I just saw the critique in the comments for another answer and I guess it is correct that Python will needlessly build and garbage collect lots of smaller lists with this solution. So the best thing that can be said about it is that it is very simple and concise if you're used to functional programming :-]

I found myself wanting to flatten an array of arrays while writing some Python code earlier this afternoon and being lazy my first attempt involved building the flattened array manually:

episodes = [
    {"id": 1, "topics": [1,2,3]},
    {"id": 2, "topics": [4,5,6]}

flattened_episodes = []
for episode in episodes:
    for topic in episode["topics"]:
        flattened_episodes.append[{"id": episode["id"], "topic": topic}]

for episode in flattened_episodes:
    print episode

If we run that we’ll see this output:

$ python flatten.py

{'topic': 1, 'id': 1}
{'topic': 2, 'id': 1}
{'topic': 3, 'id': 1}
{'topic': 4, 'id': 2}
{'topic': 5, 'id': 2}
{'topic': 6, 'id': 2}

flattened_episodes = [{"id": episode["id"], "topic": topic}
                      for episode in episodes
                      for topic in episode["topics"]]

for episode in flattened_episodes:
    print episode

We could also choose to use itertools in which case we’d have the following code:

from itertools import chain, imap
flattened_episodes = chain.from_iterable[
                        imap[lambda episode: [{"id": episode["id"], "topic": topic}
                                             for topic in episode["topics"]],
for episode in flattened_episodes:
    print episode

We can then simplify this approach a little by wrapping it up in a 'flatmap' function:

def flatmap[f, items]:
        return chain.from_iterable[imap[f, items]]

flattened_episodes = flatmap[
    lambda episode: [{"id": episode["id"], "topic": topic} for topic in episode["topics"]], episodes]

for episode in flattened_episodes:
    print episode

I think the list comprehensions approach still works but I need to look into itertools more - it looks like it could work well for other list operations.

Trước khi bắt đầu tìm hiểu về Java Map và flatMap, bạn nào chưa biết về Java Stream có thể đọc bài Stream – KieBlog để tìm hiểu và nhớ lại kiến thức về Stream trước khi bắt đầu vào nội dung chính của bài đọc.

1. Map trong Java Stream

Trong Stream API, phương thức Map[] hoạt động như là một functions có argument [đối số].

Thứ nhất, phương thức này là phương thức trung gian [terminal operation].Phương thức này applie tất cả các chứng năng có ở funtions cho các elements trong Stream.

Cùng xem qua ví dụ sau đây:

Ở ví dụ trên, phương thức Map[] sử dụng phương thức String::length nhằm tính đoán độ dài các chuỗi String trong List. Kết quả trả về sẽ là một list độ dài các chuỗi.

Phương thức Map[] đã hoạt động hoàn hảo. Câu hỏi đặt ra là tại sao ta lại cần thêm phương thức flatMap[]?. Tại sao lại cần thêm phương thức này?.

Cùng tìm hiểu tiếp nhé.

Đầu tiên, không cần phải nạp vào đầu những khái niệm lằng nhằng, rắc rối. Để đơn giản và dễ hiểu, ta cứ nhớ rằng:

Ủa, vậy làm bẹp lép là làm gì?.

Flattening sẽ chuyển đổi list trong list. Merge lại tất cả lại với nhau thành một list duy nhất. Tất nhiên, nó bao gồm tất cả các phần tử có trong list con.

Từ từ, hãy cùng phân tích định nghĩa đã

3. Tại sao lại cần thêm flatmap?

Để hiểu được tại sao lại cần thêm flatmap, hãy cùng xem xét hai ví dụ sau đây:

Ta có một Array String các chuỗi mã hóa bị trùng lặp. Bài toán đặt ra: loại bỏ trùng lặp, lấy giá trị chuỗi.

Ù uôi, dễ thế!. Chẳng phải sử dụng Java distince[] kết hợp với Map là sẽ xong sao?. Vấn đề không đơn giản như thế!, yêu cầu ngặt ngèo hơn. Kiểu trả về bắt buộc phải là Stream, không được sử dụng thêm phương thức nào ngoài khác Stream API.

Đoạn source này cho ta kết quả chính xác. Đoạn mã được loại bỏ trùng lắp. Nhưng kiểu trả về thì lại là List.

Tại sao lại vậy?. Nguyên nhân là do Stream sẽ thực hiện chia tách và loại bỏ các từ trên từng Object String trong Arrays.

Đây chính là lúc mà ta cần tới flatMap:

Để ý tới hình ảnh phía dưới để biết phương thức flatMap[] đã loại bỏ trùng lặp và trả về cho ta một List duy nhất như thế nào.

4. Kết luận

The main difference between the map and flatMap is the return type.

Điểm khác biệt cốt lõi giữa map và flatMap là kiểu trả về [return type].

The Stream’s map[] method produces or returns a single result value, which is sent to the Output stream.

Phương thức Stream map[] chỉ xử lí và trả về duy nhất một kết quả, kết quả này được trả về thông qua Output của stream.

The Stream’s flatMap[] method produces or returns a Stream of elements.

Phương thức Stream flatMap[] sẽ xử lí và trả về danh sách các stream.

The map[] method is only used for modification while the flatMap[] method is used for both flattening and modification.

Khác với phương thức map[], flatMap[] ngoài sử dụng để sửa đổi còn kết hợp cả phương thức flattening. Dàn đều các elements trong danh sách Stream.

flat Map[] là một function đơn [unary function]. Function này nhận vào các element [phần tử], trả về một stream.

The flatMap[] method replaces a value with a Stream and join all Streams together

Phương thức flatMap[] thay thế các giá trị bằng Stream, KẾT HỢP các Stream lại với nhau.

5. Tham khảo

  • The Difference Between map[] and flatMap[] – javadevjournal.
  • Java Flat Map Example – javacodegeeks.
  • Stream flatMap[] with example – geeksforgeeks.

Chủ Đề