Hướng dẫn using r in python - sử dụng r trong python
Package Show Cả ngôn ngữ lập trình R và Python có nhiều điểm chung cũng như vài khác biệt. Hầu hết các ý tưởng tiềm ẩn về cấu trúc dữ liệu của 2 ngôn ngữ này khá là giống nhau. Có nhiều package data science đang tồn tại cho cả 2 ngôn ngữ lập trình này. Nhưng R lại được thiết lập theo 1 cách mà mình sẽ mô tả như là ‘dữ liệu trước, ứng dụng sau’. Trong khi Python thì ngược lại khi nó nghiêng về việc phát triển ứng dụng được điều hướng từ ‘outlet’ nhiều hơn. Mình có 1 ví dụ: các lập trình viên Javascript sẽ dễ học ngôn ngữ lập trình Python hơn là R, vốn đã quen với syntax và việc quản lý ‘environment’. Hơn thế nữa, mình đã làm việc cả trên R và Python và đã có lúc gặp phải các tình huống mà mình sẽ muốn dùng cả 2 cùng với nhau. Điều này xảy ra vì 1 vài lý do, và lý do phổ biến nhất chính mình gặp phải là khi bạn đang build 1 thứ gì đó ở R, và bạn cần functionality mà chính bạn hay ai đó đã viết rồi bằng ngôn ngữ lập trình Python. Chắc chắn rằng bạn có thể viết lại nó với R, nhưng mình có cách tiện hơn để giúp bạn làm điều này. Package Tuyển it python nhiều ngành nghề hot Environment trong R và PythonBất kỳ dự án lập trình nào cũng đều tổ chức trong 1 environment, nơi chứa và truy cập tất cả mọi thứ nó cần hay được tạo nên trong quá trình vận hành của nó. Trong ngôn ngữ R, 1 environment tổng quát thông thường đều khả dụng với tất cả dự án ngôn ngữ dựa trên R và đều được cài đặt sẵn các gói cho việc truy cập. Có nghĩa là tất cả các dự án trong ngôn ngữ R thường đều được chạy trên cùng 1 environment cốt lõi (core environment) như nhau. Mình có 1 cách nghĩ về việc này là bạn hãy thử tưởng tượng tất cả mọi người trong nhà bạn đều sử dụng chung 1 cục sạc cho iPhone của họ. Nên để sạc điện thoại, họ phải rời khỏi phòng mình để tới nơi có sạc, và nếu họ bán chiếc điện thoại đi, người mua sẽ cần tự lo việc mua đồ sạc khác. Tuy nhiên, trong Python, mỗi dự án thường cần được thiết lập để hoàn toàn có thể ‘self-contain’ – với environment của riêng nó, bản copy base Python của riêng nó và các bản copy độc lập của tất cả ‘module’ mà nó cần để vận hành. Tương tự ví dụ trên bạn thử nghĩ về điều này như là mỗi người trong nhà bạn đều có riêng 1 cục sạc cho iPhone của họ. Họ không cần phải ra ngoài và cắm nó ở nơi nào khác, và khi họ bán chiếc điện thoại đi, thì nó cũng sẽ đi kèm với cục sạc rồi. Trong khoản xét về các tiến trình cài đặt cũng như các nguồn tài nguyên disk/ memory thì model của Python khá là xa xỉ, nhưng bù lại lại nó cho phép việc chuyển đổi các cá thể độc lập đi kèm cấu hình tối thiểu của các dự án dễ dàng hơn. Không quá khó để thấy nó đã phát triển hiệu quả ra sao, khi nó vượt qua tư duy quy củ của việc phát triển phần mềm truyền thống, đó cũng là lý do tại sao mình nghĩ Python như hướng về ứng dụng (application driven) nhiều hơn. Đây là tí hình ảnh mình tự phác thảo ra để giải thích các khoản đơn giản về điểm khác biệt giữa cách mà các environment thường hoạt động trong ngôn ngữ R và Python: Cấu hình Environment điển hình trong R và Python Giờ đây, nếu bạn muốn Python liên lạc được với R, thì nó vẫn cần tìm environment của riêng nó – bạn không thể chỉ đơn giản bắt nó truy cập global environment của R. Việc này cũng giống như bạn đang nói tiếng Việt với người nước ngoài để hỏi đường vậy.. Cho nên là để có thể làm Python hoạt động được bên trong dự án R của bạn, bạn cần phải có 2 thứ:
Thiết lập 1 environment cho PythonTừ giờ trở đi mình sẽ cho các bạn 1 ví dụ đơn giản. Cứ cho rằng mình đang có 1 dự án R trong RStudio, vốn đang cần 1 function mà mình đã viết rồi bằng ngôn ngữ lập trình Python. Và đây là function đơn giản mà mình đã lưu trong 1 script Python có tên from scipy.constants import c def light_years(dist, unit = "km"): c_per_year = c * 60 * 60 * 24 * 365.25 if unit == "km": dist_meters = dist * 1000 elif unit == "mi": dist_meters = dist * 1.60934 * 1000 else: sys.exit("Cannot use that unit!") return dist_meters/c_per_year Mình đang dùng 1 function rất đơn giản ở đây để làm rõ cho bài viết này, hơi phi thực tế, hơi hơi ngớ ngẩn 1 chút vì mình đã import toàn bộ package
Không quá khó để thiết lập 1 environment Python cho dự án R của bạn. Cho thấy tầm quan trọng của environment dự án trong Python là như thế nào, sự hiện diện của nhiều công cụ quản lý environment, vốn cũng dễ dàng sử dụng. Bộ tool yêu thích của mình là Anaconda. Hiện đang có 2 version trên thị trường. Version đầy đủ, chứa cả vũ trụ rộng lớn bao gồm tất cả những gì mà 1 environment có thể cần, bao gồm tất cả những module thường được sử dụng nhất của Python. Và theo sau là Miniconda, vốn dễ dàng hơn trên disk space và thích hợp hơn cho nhiều người dùng Python được giới hạn. Bạn có thể lấy Miniconda cho hệ điều hành của bạn tại đây. Hãy chắc chắn rằng bạn đang tải Conda phù hợp với version Python bạn muốn làm việc cùng. 1 khi bạn đã cài đặt Conda rồi, nếu bạn đang dùng MacOS hay Linux, bạn sẽ thường phải cài đặt các environment của bạn bằng cách dùng dòng lệnh. Chỉ cần định vị nó tới thư mục dự án R (trong trường hợp của mình là conda create --name test_python Chỉ đơn giản vậy thôi, bạn đã tạo ra được 1 environment Python. Mình thường đặt tên environment của mình giống như tên thư mục dự án để tránh sự nhầm lẫn trong tương lai. Bây giờ bạn cần nói với Conda để dùng environment đó cho dự án này, cho nên hãy dùng lệnh này ngay tại dòng lệnh trong thư mục conda activate test_python Và bây giờ bạn đã liên kết dự án này tới environment Python, và có 1 bản sao của của base Python trong đó để đoạn code của bạn chạy qua. Cuối cùng, function của chúng ta cần package conda install scipy Conda rồi sẽ cài đặt conda info --envs Điều này nói cho mình biết rằng, như 1 ví dụ, rằng environment của mình đã được cài đặt tại Chạy function Python của bạn trong R
Sys.setenv(RETICULATE_PYTHON = "/Users/topdev/opt/miniconda3/envs/test_python/bin/python3") Bây giờ hãy lưu file text này bên trong thư mục dự án với tên Đầu tiên bạn có thể test xem liệu R biết vị trí của Python không. reticulate::source_python("light_years.py") Giờ bạn đã có function > light_years(1000000000000000, "mi") [1] 170.1074 Thật tuyệt phải không nào! Rõ ràng đây là 1 ví dụ khá đơn giản nhưng nó thực sự cho bạn biết tất cả những thứ bạn cần về cách tích hợp code Python vào script R của bạn. Bạn có thể tưởng tượng cách bạn có thể đem tất cả các loại function hay package vốn chỉ đang dành riêng cho Python và làm cho chúng hoạt động được trong R – khá là thú vị phải không nào. Gần đây mình cần một thuật toán phát hiện cộng đồng đồ thị mới (graph community detection algorithm) có tên là Để biết thêm về cách sử dụng Anaconda hay Miniconda để thiết lập environment Python, hướng dẫn sử dụng cho người dùng sẽ ở đây. Để tìm hiểu thêm về các loại function có sẵn để dịch từ Python sang R, có 1 họa tiết ‘reticulate khá ổn ở đây. Chào tạm biệt !đây. Để tìm hiểu thêm về các loại function có sẵn để dịch từ Python sang R, có 1 họa tiết ‘reticulate khá ổn ở đây. Chào tạm biệt ! TopDev via towardsdatascience via towardsdatascience Đừng quên xem thêm các bài viết:: 5 nguyên nhân chính vì sao các nhà khoa học dữ liệu rời bỏ công việc của mình Con đường để trở thành một fullstack developer (Phần 1: Những nỗi sợ) Con đường để trở thành một fullstack developer (Phần 2: Xem xét lại các kế hoạch) Cơ hội việc làm cntt hấp dẫn tại TopDev đang chờ bạn! |