Đọc tệp zip từ kho lưu trữ azure blob python

Một thẻ đã tồn tại với tên chi nhánh được cung cấp. Nhiều lệnh Git chấp nhận cả tên thẻ và tên nhánh, vì vậy việc tạo nhánh này có thể gây ra hành vi không mong muốn. Bạn có chắc chắn muốn tạo nhánh này không?

Sử dụng Python, bạn có thể lập trình rất nhiều tác vụ nhờ thư viện phong phú của nó. Một trong những tác vụ mà bạn có thể thực hiện khi sử dụng chương trình Python là tải xuống tệp zip từ một URL

Trong bài viết Python này, bạn sẽ thấy nhiều ví dụ về Cách tải xuống tệp zip từ URL bằng python

  • Python quên tải xuống tệp zip
  • Mô-đun yêu cầu Python để tải xuống tệp zip
  • Tệp zip tải xuống Python từ URL và giải nén
  • Python tải xuống nhiều tệp zip từ URL
  • Tệp zip tải xuống Python từ Github
  • Tải xuống tệp zip từ lưu trữ Azure blob python

Mục lục

  • Python quên tải xuống tệp zip
  • Mô-đun yêu cầu Python để tải xuống tệp zip
  • Tệp zip tải xuống Python từ URL và giải nén
  • Python tải xuống nhiều tệp zip từ URL
    • Phương pháp thay thế
  • Tệp zip tải xuống Python từ Github
  • Tải xuống tệp zip từ lưu trữ Azure blob python

Python quên tải xuống tệp zip

Một cách để tải xuống tệp zip từ URL trong Python là sử dụng hàm wget[]. Nhưng trước tiên bạn cần cài đặt thư viện wget bằng tiện ích dòng lệnh pip

Trong dấu nhắc lệnh của bạn, hãy thực thi mã bên dưới để cài đặt thư viện wget

 pip install wget

Sau khi cài đặt, bạn sẽ thấy một đầu ra như màn hình bên dưới

Cài đặt thư viện wget

Bây giờ bạn có thể sử dụng thư viện wget để tải xuống tệp zip. Dưới đây là cú pháp sử dụng hàm wget

wget['URL of the zip file']

Ví dụ: liên kết để tải xuống tệp nguồn zip cho golang là “https. // golang. org/dl/go1. 17. 3. cửa sổ-amd64. nén”. Tôi có thể thực thi đoạn mã Python bên dưới để tải xuống tệp zip này

import wget
url='//golang.org/dl/go1.17.3.windows-amd64.zip'
wget.download[url]

Bạn sẽ thấy tiến trình trong bảng điều khiển đầu ra

Tải xuống tệp zip bằng wget

Bạn có thể thấy tệp zip của mình trong cùng thư mục mà bạn đã lưu tệp mã nguồn Python

Bạn cũng có thể sử dụng tùy chọn wget theo cách khác. Có thể tải xuống cùng một tệp zip bằng cách thực thi mã bên dưới trong dòng lệnh

python -m wget '//golang.org/dl/go1.17.3.windows-amd64.zip' -o 'C:\Users\Blades\Downloads'

Sử dụng cờ -o, bạn có thể chỉ định đường dẫn tải xuống cho tệp zip

Do đó, theo cách này, bạn có thể sử dụng thư viện wget trong Python để tải xuống tệp zip từ một URL

Đọc. Hàm trả về Python

Mô-đun yêu cầu Python để tải xuống tệp zip

Bạn cũng có thể tải xuống tệp zip từ một URL bằng cách sử dụng mô-đun yêu cầu. Chúng tôi phải gửi yêu cầu tới URL tệp zip và lưu trữ kết quả trong một biến. Sau đó, chúng tôi có thể ghi nội dung zip này vào hệ thống tệp cục bộ

Nhưng mà. trước tiên, bạn phải cài đặt mô-đun này vào trình biên dịch Python của mình bằng lệnh pip

pip install requests

Cài đặt mô-đun yêu cầu

Bây giờ bạn chỉ cần nhập mô-đun vào mã của mình và bắt đầu sử dụng nó

Ví dụ: nếu tôi phải tải xuống tệp zip từ URL 'https. // golang. org/dl/go1. 17. 3. cửa sổ-amd64. zip’, tôi có thể viết đoạn mã Python bên dưới

# importing the requests module
import requests
print['Downloading started']
url = '//golang.org/dl/go1.17.3.windows-amd64.zip'

# Downloading the file by sending the request to the URL
req = requests.get[url]
 
# Split URL to get the file name
filename = url.split['/'][-1]
 
# Writing the file to the local file system
with open[filename,'wb'] as output_file:
    output_file.write[req.content]
print['Downloading Completed']

Trong đoạn mã trên, chúng tôi đang gửi yêu cầu GET tới URL đã chỉ định và trả về nội dung tệp zip trong phản hồi. Sau đó, chúng tôi đã ghi nội dung tệp zip vào một tệp trong hệ thống tệp cục bộ của chúng tôi

Tải xuống tệp zip bằng mô-đun yêu cầu

Bạn có thể xác minh tải xuống ở vị trí của tệp mã nguồn Python của bạn. Do đó, bạn có thể đã học cách tải xuống tệp zip từ một URL trong Python bằng mô-đun yêu cầu

Đọc. Python tìm chỉ mục của phần tử trong danh sách

Tệp zip tải xuống Python từ URL và giải nén

Trong phần này, bạn sẽ tìm hiểu cách tải xuống và giải nén tệp zip vào hệ thống tệp cục bộ của mình

Chúng tôi sẽ cần ba mô-đun

  • yêu cầu. Để tải xuống tệp zip
  • byteIO. Để đọc tệp từ bộ đệm
  • zipfile. Để đọc và giải nén tệp zip

Ví dụ: đoạn mã python bên dưới sẽ tải xuống tệp zip từ URL được chỉ định và giải nén tệp zip vào hệ thống tệp cục bộ

# importing necessary modules
import requests, zipfile
from io import BytesIO
print['Downloading started']

#Defining the zip file URL
url = '//www.learningcontainer.com/wp-content/uploads/2020/05/sample-zip-file.zip'

# Split URL to get the file name
filename = url.split['/'][-1]

# Downloading the file by sending the request to the URL
req = requests.get[url]
print['Downloading Completed']

# extracting the zip file contents
zipfile= zipfile.ZipFile[BytesIO[req.content]]
zipfile.extractall['C:/Users/Blades/Downloads/NewFolder']

Tải xuống và giải nén tệp zip bằng python

Trong đoạn mã trên, trước tiên, chúng tôi đang tải xuống tệp zip và lưu trữ nội dung của nó vào một biến

Sau đó, chúng tôi đang sử dụng hàm BytesIO để đọc nội dung tệp zip và lưu trữ chúng trong một biến ở định dạng zip

Cuối cùng, chúng tôi đang sử dụng hàm extractall[] để trích xuất dữ liệu tệp zip vào hệ thống tệp cục bộ

Ghi chú. Khi xác định đường dẫn tệp trong hàm extractall[], hãy sử dụng dấu gạch chéo xuôi [/] thay vì dấu gạch chéo ngược [\]. Nếu không, bạn sẽ phải đối mặt với một lỗi

Ngoài ra, bạn cũng có thể thêm r trước đường dẫn để biến nó thành chuỗi thô. Ví dụ

zipfile.extractall[r'C:\Users\Blades\Downloads\NewFolder']

Vì vậy, bạn có thể đã học cách tải xuống và giải nén tệp zip từ một URL trong python

Đọc. Python tìm số trong Chuỗi

Python tải xuống nhiều tệp zip từ URL

Trong phần này, tôi sẽ giải thích cách bạn có thể tải xuống nhiều tệp zip từ một URL

Bạn có thể gặp phải tình huống khi muốn tải xuống tất cả các tệp zip từ một trang web với sự trợ giúp của Python. Trong trường hợp đó, bạn có thể sử dụng kỹ thuật sau để tải xuống tất cả các tệp zip

  • Chúng tôi đã sử dụng mô-đun yêu cầu để thực hiện tác vụ này. Bạn có thể cài đặt mô-đun này bằng lệnh pip trong python
  • Thứ hai, chúng tôi đã sử dụng thư viện BeautifulSoup để xóa nội dung phản hồi của trang web
  • Bước đầu tiên là tìm nạp trang web nơi tất cả các liên kết đến tệp zip xuất hiện
  • Sau đó, tôi đã xóa phản hồi của yêu cầu bằng thư viện BeautifulSoup
  • Sau đó, tôi đã tìm nạp tất cả các URL của tệp zip và lưu trữ chúng trong một tệp văn bản
  • Khi tất cả các liên kết được lưu trữ trong tệp văn bản, tôi sẽ tải xuống mọi tệp zip bằng cách đọc URL từ tệp văn bản và gửi yêu cầu GET tới URL
  • Do đó, một tệp được tải xuống trong phản hồi
  • Tôi đã tạo một tệp zip mới trong hệ thống tệp cục bộ và ghi nội dung tệp zip đã tải xuống ở bước trước
________số 8

Tải xuống nhiều tệp Zip

Khi chương trình được thực thi thành công, bạn sẽ thấy rằng tất cả các tệp zip được tải xuống trong vị trí mã nguồn Python của bạn

Phương pháp thay thế

Ngoài ra còn có một phương pháp khác để làm điều này tôi. e sử dụng hàm wget[]

Bạn phải cài đặt thư viện wget bằng lệnh pip

Sau đó, bạn có thể thực thi đoạn mã dưới đây để tải xuống tất cả các tệp zip từ một URL

# importing the necessary modules
import requests
from bs4 import BeautifulSoup
import wget

# Creating a new file to store the zip file links
newfile = open['zipfiles.txt','w']

#Set variable for page to be opened and url to be concatenated 
page =requests.get['//sample-videos.com/download-sample-zip.php']
baseurl= '//sample-videos.com/'

#Use BeautifulSoup to clean up the page
soup = BeautifulSoup[page.content]
soup.prettify[]

#Find all the links on the page that end in .zip and write them into the text file
for anchor in soup.findAll['a', href=True]:
    links = anchor['href']
    if links.endswith['.zip']:
        newfile.write[links + '\n']
newfile.close[]

#Fetching the links for the zip file and downloading the files
with open['zipfiles.txt', 'r'] as links:
    for link in links:
        if link:
            link = baseurl + link
            wget.download[link[:-1]]

Cách tiếp cận gần giống như cách tiếp cận trên. Sự khác biệt duy nhất là chúng tôi đang sử dụng thư viện wget để tải xuống tệp thay vì thư viện yêu cầu

Lợi ích của việc sử dụng thư viện wget là bạn cũng có thể thấy thanh tiến trình tải xuống của mình như trong hình bên dưới

Tải xuống tất cả các tệp zip từ một URL

Vì vậy, bạn có thể đã học cách tải xuống tất cả các tệp zip từ một trang web bằng python

Đọc. Xóa các ký tự không phải ASCII Python

Tệp zip tải xuống Python từ Github

Trong phần này, tôi sẽ giải thích cách bạn có thể tải xuống tệp zip từ Github bằng python

Trong bất kỳ kho lưu trữ Github nào, bạn có tùy chọn tải xuống mã nguồn dưới dạng tệp zip. Nhìn vào hình ảnh dưới đây để tham khảo

Tải xuống liên kết tệp zip trong Github

Bạn có thể sử dụng liên kết này trong chương trình Python của mình để tải xuống tệp zip này. Bạn có thể sử dụng bất kỳ phương pháp nào được giải thích trong các phần trên. Ví dụ: bạn có thể sử dụng wget[] để tải xuống tệp zip bằng mã Python bên dưới

wget['URL of the zip file']
0

Khi mã được thực thi thành công, bạn có thể thấy tệp được tạo trong thư mục mà bạn đã lưu trữ tệp mã nguồn python

Bằng cách này, bạn có thể tải xuống tệp zip từ Github bằng Python

Đọc. Python chuyển đổi nhị phân sang thập phân

Tải xuống tệp zip từ lưu trữ Azure blob python

Để làm việc với bộ lưu trữ Azure blob trong Python, bạn cần cài đặt thư viện có tên azure-storage-blob. Để cài đặt thư viện này trong trình biên dịch Python của bạn, hãy thực hiện lệnh dưới đây trong dấu nhắc lệnh của bạn

wget['URL of the zip file']
1

Tải xuống thư viện lưu trữ Azure

Khi bạn đã cài đặt thư viện này, bạn có thể viết mã để tải xuống tệp zip từ bộ chứa Azure blob. Quá trình này được giải thích dưới đây

  • Đầu tiên, chúng tôi sẽ tạo kết nối với tệp được lưu trữ trong bộ lưu trữ Azure bằng chuỗi kết nối
  • Sau đó, chúng tôi sẽ tải xuống tệp từ bộ lưu trữ
  • Cuối cùng, chúng tôi sẽ lưu tệp trong hệ thống tệp cục bộ của chúng tôi

Để lấy chuỗi kết nối cho bộ lưu trữ Azure của bạn

  • Điều hướng đến bộ chứa bộ lưu trữ Azure của bạn và nhấp vào Khóa truy cập trong tab Bảo mật + Mạng
  • Bạn sẽ thấy một danh sách các phím. Nhưng tất cả chúng sẽ được ẩn đi
  • Nhấp vào Show Keys để xem các phím
  • Các chuỗi kết nối của các phím được liệt kê cùng với chúng. Bạn có thể sử dụng bất kỳ chuỗi kết nối nào

Khóa truy cập bộ nhớ Azure

Giờ đây, bạn có thể thực thi mã Python bên dưới để tải xuống tệp zip được lưu trữ trong bộ chứa Azure

wget['URL of the zip file']
2

Thay thế thông tin đăng nhập của bạn trong đoạn mã trên

Ghi chú. Dữ liệu đang được tải xuống dưới dạng byte và được ghi trong một tệp mới. Bạn có thể đặt bất kỳ tên nào cho tệp zip mới của mình

Tải xuống tệp zip từ lưu trữ Azure blob python

Bạn có thể thấy rằng tệp zip được tải xuống trong đường dẫn đã chỉ định

Bằng cách này, bạn có thể tải xuống tệp zip từ vùng lưu trữ Azure của mình về hệ thống tệp cục bộ của mình

Ngoài ra, hãy xem thêm một số hướng dẫn về Python

  • Python Đếm từ trong tệp
  • Câu lệnh tình huống trong Python
  • Chụp màn hình Python
  • Python in đẹp JSON
  • Giá trị gia tăng từ điển Python
  • Cách đảo ngược danh sách trong Python

Do đó, bạn có thể đã học được nhiều cách khác nhau để tải xuống tệp zip từ URL bằng Python

  • Python quên tải xuống tệp zip
  • Mô-đun yêu cầu Python để tải xuống tệp zip
  • Tệp zip tải xuống Python từ URL và giải nén
  • Python tải xuống nhiều tệp zip từ URL
  • Tệp zip tải xuống Python từ Github
  • Tải xuống tệp zip từ lưu trữ Azure blob python

Bijay Kumar

Python là một trong những ngôn ngữ phổ biến nhất ở Hoa Kỳ. Tôi đã làm việc với Python trong một thời gian dài và tôi có kinh nghiệm làm việc với nhiều thư viện khác nhau trên Tkinter, Pandas, NumPy, Turtle, Django, Matplotlib, Tensorflow, Scipy, Scikit-Learn, v.v… Tôi có kinh nghiệm làm việc với nhiều khách hàng khác nhau . Kiểm tra hồ sơ của tôi

Làm cách nào để đọc dữ liệu từ bộ lưu trữ blob Azure bằng Python?

Dưới đây là các bước cần thực hiện cho quy trình này. .
Tải xuống dữ liệu từ Azure blob với mẫu mã Python sau bằng dịch vụ Blob. Thay thế biến trong đoạn mã sau bằng các giá trị cụ thể của bạn. Bản sao Python. .
Đọc dữ liệu vào DataFrame của gấu trúc từ tệp đã tải xuống. Bản sao Python

Python có thể đọc tệp từ ZIP không?

Python có thể làm việc trực tiếp với dữ liệu trong tệp ZIP . Bạn có thể xem danh sách các mục trong thư mục và tự làm việc với các tệp dữ liệu. Công thức này là một đoạn mã liệt kê tất cả tên và độ dài nội dung của các tệp có trong tệp zip lưu trữ ZIP. khóa kéo.

Chủ Đề