Hướng dẫn dùng numpy download python

Các khóa học miễn phí qua video:
Lập trình C Java SQL Server PHP HTML5-CSS3-JavaScript

Mục lục bài viết:

  • Chọn NumPy: Lợi ích
  • Cài đặt NumPy
    • Sử dụng Repl.it làm Trình chỉnh sửa trực tuyến
    • Cài đặt NumPy với Anaconda
    • Cài đặt NumPy bằng pip
    • Sử dụng IPython, Notebooks hoặc JupyterLab
  • Xin chào NumPy: Hướng dẫn kiểm tra độ cong
  • Bắt đầu hình dạng: Hình dạng mảng và trục
    • Làm chủ hình dạng
    • Hiểu Axes
    • Phát thanh truyền hình
  • Hoạt động Khoa học Dữ liệu: Lọc, Đặt hàng, Tổng hợp
    • Lập chỉ mục
    • Tạo mặt nạ và lọc
    • Vận chuyển, sắp xếp và ghép nối
    • Tổng hợp
  • Ví dụ thực tế 1: Triển khai một chuỗi Maclaurin
  • Tối ưu hóa lưu trữ: Các loại dữ liệu
    • Kiểu số: int, bool, float và complex
    • Các loại chuỗi: Unicode có kích thước
    • Mảng có cấu trúc
    • Thông tin thêm về các loại dữ liệu
  • Nhìn về phía trước: Thư viện mạnh mẽ hơn
    • gấu trúc
    • scikit-học
    • Matplotlib
  • Ví dụ thực tế 2: Thao tác hình ảnh với Matplotlib
  • Phần kết luận

NumPy là một thư viện Python cung cấp cấu trúc dữ liệu đơn giản nhưng mạnh mẽ: mảng n-chiều . Đây là nền tảng mà trên đó hầu như tất cả sức mạnh của bộ công cụ khoa học dữ liệu của Python được xây dựng và học NumPy là bước đầu tiên trên hành trình của bất kỳ nhà khoa học dữ liệu Python nào. Hướng dẫn này sẽ cung cấp cho bạn kiến ​​thức cần thiết để sử dụng NumPy và các thư viện cấp cao hơn dựa vào nó.

Trong hướng dẫn này, bạn sẽ học:

  • Có gì khái niệm cốt lõi trong khoa học dữ liệu có thể được thực hiện bởi NumPy
  • Cách tạo mảng NumPy bằng nhiều phương pháp khác nhau
  • Cách thao tác với mảng NumPy để thực hiện các phép tính hữu ích
  • Cách áp dụng những kỹ năng mới này vào các vấn đề trong thế giới thực

Để tận dụng tối đa hướng dẫn NumPy này, bạn nên làm quen với việc viết mã Python. Làm việc thông qua Lộ trình học Python Giới thiệu là một cách tuyệt vời để đảm bảo bạn đã có các kỹ năng cơ bản. Nếu bạn đã quen thuộc với toán học ma trận , thì điều đó chắc chắn cũng sẽ hữu ích. Tuy nhiên, bạn không cần biết bất cứ điều gì về khoa học dữ liệu. Bạn sẽ học được điều đó ở đây.

Ngoài ra còn có một kho lưu trữ các mẫu mã NumPy mà bạn sẽ thấy trong suốt hướng dẫn này. Bạn có thể sử dụng nó để tham khảo và thử nghiệm với các ví dụ để xem việc thay đổi mã sẽ thay đổi kết quả như thế nào. Để tải xuống mã, hãy nhấp vào liên kết bên dưới:

Chọn NumPy: Lợi ích

Vì bạn đã biết Python, bạn có thể tự hỏi mình liệu bạn có thực sự phải học một mô hình hoàn toàn mới để làm khoa học dữ liệu hay không. Các forvòng lặp của Python thật tuyệt vời! Đọc và ghi tệp CSV có thể được thực hiện bằng mã truyền thống. Tuy nhiên, có một số lý lẽ thuyết phục để học một mô hình mới.

Dưới đây là bốn lợi ích hàng đầu mà NumPy có thể mang lại cho mã của bạn:

  1. Tốc độ nhanh hơn: NumPy sử dụng các thuật toán được viết bằng C hoàn thành trong nano giây chứ không phải giây.
  2. Ít vòng lặp hơn: NumPy giúp bạn giảm các vòng lặp và không bị rối trong các chỉ số lặp lại.
  3. Mã rõ ràng hơn: Không có vòng lặp, mã của bạn sẽ trông giống như các phương trình mà bạn đang cố gắng tính toán.
  4. Chất lượng tốt hơn: Có hàng nghìn cộng tác viên đang làm việc để giữ cho NumPy nhanh chóng, thân thiện và không có lỗi.

Vì những lợi ích này, NumPy là tiêu chuẩn thực tế cho mảng đa chiều trong khoa học dữ liệu Python và nhiều thư viện phổ biến nhất được xây dựng dựa trên nó. Học NumPy là một cách tuyệt vời để thiết lập một nền tảng vững chắc khi bạn mở rộng kiến ​​thức của mình sang các lĩnh vực khoa học dữ liệu cụ thể hơn.

Cài đặt NumPy

Đã đến lúc thiết lập mọi thứ để bạn có thể bắt đầu học cách làm việc với NumPy. Có một số cách khác nhau để thực hiện việc này và bạn không thể làm sai bằng cách làm theo hướng dẫn trên trang web NumPy . Nhưng có một số chi tiết bổ sung cần lưu ý được nêu dưới đây.

Bạn cũng sẽ cài đặt Matplotlib . Bạn sẽ sử dụng nó trong một trong các ví dụ sau để khám phá cách các thư viện khác sử dụng NumPy.

Sử dụng Repl.it làm Trình chỉnh sửa trực tuyến

Nếu bạn chỉ muốn bắt đầu với một số ví dụ, hãy làm theo hướng dẫn này và bắt đầu xây dựng một số bộ nhớ cơ bắp với NumPy, thì Repl.it là một lựa chọn tuyệt vời để chỉnh sửa trong trình duyệt. Bạn có thể đăng ký và kích hoạt môi trường Python trong vài phút. Dọc theo bên trái, có một tab cho các gói. Bạn có thể thêm bao nhiêu tùy thích. Đối với hướng dẫn NumPy này, hãy xem các phiên bản hiện tại của NumPy và Matplotlib.

Đây là nơi bạn có thể tìm thấy các gói trong giao diện:

May mắn thay, chúng cho phép bạn chỉ cần nhấp chuột và cài đặt.

Cài đặt NumPy với Anaconda

Bản phân phối Anaconda là một bộ công cụ khoa học dữ liệu Python phổ biến được đóng gói xung quanh trình quản lý gói giúp quản lý môi trường ảo và các phụ thuộc dự án của bạn. Nó được xây dựng xung quanh conda, là trình quản lý gói thực tế. Đây là phương pháp được đề xuất bởi dự án NumPy, đặc biệt nếu bạn đang bước vào lĩnh vực khoa học dữ liệu bằng Python mà chưa thiết lập một môi trường phát triển phức tạp .

Nếu bạn đã có một quy trình làm việc mà bạn thích sử dụng pip, Pipenv , Thơ hoặc một số bộ công cụ khác, thì tốt hơn là không nên thêm condavào hỗn hợp. Các condakho gói tách biệt với PyPI , và condasẽ thiết lập một chút hòn đảo riêng biệt của gói trên máy tính của bạn, vì vậy quản lý đường dẫn và ghi nhớ mà cuộc sống gói ở đâu có thể là một cơn ác mộng .

Sau khi condacài đặt xong, bạn có thể chạy installlệnh cho các thư viện mà bạn cần:

$ conda install numpy matplotlib

Điều này sẽ cài đặt những gì bạn cần cho hướng dẫn NumPy này và bạn sẽ sẵn sàng.

Cài đặt NumPy với pip

Mặc dù dự án NumPy khuyên bạn nên sử dụng condanếu bạn đang bắt đầu mới, không có gì sai khi bạn tự quản lý môi trường của mình và chỉ sử dụng các ứng dụng cũ tốt pip, Pipenv, Thơ hoặc bất kỳ thứ gì khác thay thếpip là yêu thích của bạn.

Dưới đây là các lệnh để thiết lập pip:

$ mkdir numpy-tutorial
$ cd numpy-tutorial
$ python3 -m venv .numpy-tutorial-venv
$ source .numpy-tutorial-venv/bin/activate

[.numpy-tutorial-venv]
$ pip install numpy matplotlib
Collecting numpy
  Downloading numpy-1.19.1-cp38-cp38-macosx_10_9_x86_64.whl [15.3 MB]
     |████████████████████████████████| 15.3 MB 2.7 MB/s
Collecting matplotlib
  Downloading matplotlib-3.3.0-1-cp38-cp38-macosx_10_9_x86_64.whl [11.4 MB]
     |████████████████████████████████| 11.4 MB 16.8 MB/s
...

Sau đó, hãy đảm bảo rằng môi trường ảo của bạn đã được kích hoạt và tất cả mã của bạn sẽ chạy như mong đợi.

Sử dụng IPython, Notebooks hoặc JupyterLab

Mặc dù các phần trên sẽ cung cấp cho bạn mọi thứ bạn cần để bắt đầu, nhưng có một số công cụ khác mà bạn có thể tùy chọn cài đặt để làm việc trong khoa học dữ liệu thân thiện hơn với nhà phát triển.

IPython là một vòng lặp đọc-đánh giá-in [REPL] của Python được nâng cấp giúp việc chỉnh sửa mã trong phiên thông dịch trực tiếp trở nên đơn giản hơn và đẹp hơn. Đây là phiên IPython REPL trông như thế nào:

>>>

In [1]: import numpy as np

In [2]: digits = np.array[[
   ...:     [1, 2, 3],
   ...:     [4, 5, 6],
   ...:     [6, 7, 9],
   ...: ]]

In [3]: digits
Out[3]:
array[[[1, 2, 3],
       [4, 5, 6],
       [6, 7, 9]]]

Nó có một số khác biệt so với một REPL Python cơ bản, bao gồm số dòng của nó, cách sử dụng màu sắc và chất lượng của hình ảnh hóa mảng. Ngoài ra còn có rất nhiều phần thưởng trải nghiệm người dùng giúp việc nhập, nhập lại và chỉnh sửa mã trở nên dễ chịu hơn.

Bạn có thể cài đặt IPython dưới dạng độc lập:

Ngoài ra, nếu bạn đợi và cài đặt bất kỳ công cụ nào tiếp theo, thì chúng sẽ bao gồm một bản sao của IPython.

Một sự thay thế tính năng hơn một chút cho REPL là một sổ ghi chép . Tuy nhiên, sổ ghi chép là một phong cách viết Python hơi khác so với các tập lệnh tiêu chuẩn. Thay vì một tệp Python truyền thống, chúng cung cấp cho bạn một loạt các tập lệnh nhỏ được gọi là các ô mà bạn có thể chạy và chạy lại theo bất kỳ thứ tự nào bạn muốn, tất cả trong cùng một phiên bộ nhớ Python.

Một điều thú vị về sổ ghi chép là bạn có thể bao gồm đồ thị và hiển thị các đoạn Markdown giữa các ô, vì vậy chúng thực sự tuyệt vời để viết các phân tích dữ liệu ngay bên trong mã!

Đây là những gì nó trông giống như:

Sản phẩm máy tính xách tay phổ biến nhất có lẽ là Máy tính xách tay Jupyter , nhưng nteract là một tùy chọn khác bao gồm chức năng của Máy tính xách tay và cố gắng làm cho nó dễ tiếp cận và mạnh mẽ hơn một chút.

Tuy nhiên, nếu bạn đang xem Jupyter Notebook và nghĩ rằng nó cần nhiều phẩm chất giống IDE hơn, thì JupyterLab là một lựa chọn khác. Bạn có thể tùy chỉnh trình soạn thảo văn bản, sổ ghi chép, thiết bị đầu cuối và các thành phần tùy chỉnh, tất cả trong giao diện dựa trên trình duyệt. Nó có thể sẽ thoải mái hơn cho những người đến từ MatLab . Đây là phiên bản trẻ nhất trong số các dịch vụ, nhưng bản phát hành 1.0 của nó đã trở lại vào năm 2019, vì vậy nó sẽ ổn định và đầy đủ tính năng.

Đây là giao diện trông như thế nào:

Cho dù bạn chọn tùy chọn nào, khi bạn đã cài đặt nó, bạn sẽ sẵn sàng chạy những dòng mã NumPy đầu tiên của mình. Đã đến lúc cho ví dụ đầu tiên.

Các khóa học qua video:
Lập trình C Java SQL Server PHP HTML5-CSS3-JavaScript
« Prev: Python: Tách tập dữ liệu của bạn với train_test_split[] của scikit-learning
» Next: Python: Nhận dạng khuôn mặt với dưới 25 dòng mã Python

Chủ Đề