Databricks python thực thi lệnh shell

Hôm nay, chúng ta sẽ nói về Tạo cụm trong Azure Databricks. Nếu bạn chưa đọc các bài viết trước trong loạt bài này, Giới thiệu và Tạo cụm, chúng có thể cung cấp một số ngữ cảnh hữu ích. Bạn có thể tìm thấy các tệp từ bài đăng này trong Kho lưu trữ GitHub của chúng tôi. Hãy chuyển sang phần cốt lõi của bài viết này, Notebooks.

Như đã đề cập ở bài trước, có 3 khái niệm chính để chúng ta hiểu về Azure Databricks là Cluster, Code và Data. Đối với bài đăng này, chúng ta sẽ nói về cách tương tác để phát triển mã, Notebooks. Sổ ghi chép Azure Databricks tương tự như các công nghệ sổ ghi chép khác như Jupyter và Zeppelin, ở chỗ chúng là nơi chúng ta thực thi các đoạn mã và xem kết quả trong một giao diện duy nhất.
Sổ tay mẫu Hãy bắt đầu bằng cách tạo một sổ tay mới.
Sổ tay mới
Tạo Sổ tayTạo sổ tay là một quy trình khá đơn giản vì hầu như không cần cấu hình. Điều duy nhất chúng ta cần làm là cung cấp Tên và chọn Ngôn ngữ.
Ngôn ngữ Notebook Azure Databricks Notebooks hỗ trợ bốn ngôn ngữ lập trình, Python, Scala, SQL và R. Tuy nhiên, việc chọn một ngôn ngữ trong trình đơn thả xuống này không giới hạn chúng tôi chỉ sử dụng ngôn ngữ đó. Thay vào đó, nó đặt ngôn ngữ mặc định của sổ ghi chép. Mỗi khối mã trong sổ ghi chép được chạy độc lập và chúng tôi có thể chỉ định ngôn ngữ cho từng khối mã theo cách thủ công.

Trước khi bắt đầu mã hóa thực sự, chúng tôi cần đính kèm sổ ghi chép mới của mình vào một cụm hiện có. Như chúng tôi đã nói, Sổ ghi chép không gì khác hơn là một giao diện cho mã tương tác. Quá trình xử lý được thực hiện trên cụm bên dưới.
Sổ tay tách rời
Sổ tay đính kèm
Sổ tay đính kèm Bây giờ chúng ta đã được đính kèm vào một cụm, chúng ta có thể chạy một số lệnh mẫu. Hãy thử viết một lệnh đơn giản trong mỗi ngôn ngữ.
Python


%python


nhập gấu trúc dưới dạng pd


pysamp = pd. Khung dữ liệu [[1,2,3,4], cột = ['Samp']]

hiển thị [pysamp]



R


%r


rsamp

Chủ Đề