Hướng dẫn wordnet python install - cài đặt wordnet python
# WordNet [! : //codecov.io/gh/anuragkumarak95/wordnet/branch/master/graph/badge.svg)] (https://codecov.io/gh Yêu cầu.io/github/anuragkumarak95/wordnet/requirements.svg?branch=master)THER(https://requires.io/github/anuragkumarak95/wordnet/requirements/?branch=master) Tạo một mạng ** các từ đơn giản ** liên quan đến nhau bằng cách sử dụng API phát trực tuyến ** twitter **. ! [Được làm bằng Python-3.5] (http://forthebadge.com/images/badges/made-with-python.svg) Các phần chính của dự án này. * `Streamer`: ~/twitter_streaming.py*` tf-idf` gen: ~/wordnet/tf_idf_generator.py* `nn` words gene: ~/wordnet/nn_words.py .py ## Sử dụng chức năng Streamer 1 1. Chuyển đến root-dir (~), tạo tệp config.py với các chi tiết được đề cập bên dưới: `` python # biến có chứa thông tin đăng nhập của người dùng để truy cập API phát trực tuyến Twitter # Liên kết này sẽ giúp bạn (http: // SocialMedia -Class.org/twittertutorial.html) access_token = "xxx-xx-xxxx" access_token_secret = "xxxxx" tiêu dùng_key = "xxxxxx" Chạy `streamer` với một mảng các từ lọc mà bạn muốn tìm nạp các tweet trên. ví dụ. `$ python twitter_streaming.py Xin chào HLO HALLO Namaste> data_file.txt` Điều này sẽ lưu một dòng theo dòng từ các tweet được lọc theo các từ được sử dụng như args trong` data_file.txt`. ## Sử dụng mô -đun WordNet 1. `Bản sao repo` và cài đặt mô -đun WordNet bằng tập lệnh này, $ python setup.py Cài đặt 1. Để tạo tệp cấu trúc `tf-idf` cho mọi tài liệu, hãy sử dụng: `` `Python từ WordNet Nhập Find_TF_IDF df, tf_idf = find_tf_idf (file_names = ['file/path2', 'file/path2', ..], # đường dẫn của các tệp sẽ được xử lý. /path.tfidfpkl ', # prev tf_idf để sửa đổi, định dạng tiêu chuẩn là. .tfidfpkl. Mặc định = Không) '' 'Nếu không có tệp nào được cung cấp tham số prev_file_path, tệp TF-idf mới sẽ được tạo và các giá trị TF-IDF khác sẽ được kết hợp với tệp trước đó và được bỏ tại Dump_path nếu được đề cập, nếu không sẽ chỉ trả về danh sách TF-IDF mới mới từ điển, và từ điển DF. '' '`` `1. Để sử dụng gen từ `nn` của mô -đun này, chỉ cần sử dụng wordnet.find_knn: `` `Python từ WordNet nhập find_knn Words = find_knn (tf_idf = tf_idf, # tf_idf này được trả về bởi find_tf_idf () ở trên. 10 rand_on = true # rand_on = hoặc để bỏ qua ngẫu nhiên một vài từ hoặc hiển thị từ k ban đầu mặc định = true) '' 'Hàm này sẽ trả về một danh sách các từ liên quan chặt chẽ với Input_word được cung cấp tham khảo TF_IDF VAR được cung cấp cho nó. Sử dụng find_tf_idf () để thu thập var hoặc pickle.load () Một tệp kết xuất được bỏ bởi cùng một hàm tại thư mục bạn chọn. Tệp chứa 2 danh sách ở định dạng (IDF, TF_IDF). '' '`` ` 1. Để tạo một từ `mạng`, sử dụng: `` `Python từ WordNet Nhập Generate_Net Word_Net = Generate_Net (df = df, # df này được trả về bởi find_tf_idf () ở trên. kết xuất các tệp được tạo, tiêu chuẩn định dạng là .wrnt. default = none) '' 'Hàm này trả về một lệnh của các thực thể từ, với từ là khóa. '' '`` ` 1. Để truy xuất một từ `mạng`, sử dụng: ings Word_Net = retrieve_Net ('path/to/network.wrnt' # path vào tệp mạng, tiêu chuẩn định dạng là. '' '`` ` 1. Để truy xuất danh sách các từ ở độ sâu nào đó tạo thành một từ gốc trong mạng, hãy sử dụng: `` `Python từ WordNet Nhập trở lại_net words = return_net (word, # từ root trong quá trình này. Word_Net, # mạng từ được tạo từ Generate_Net () độ sâu = 1 # Độ sâu mà bạn muốn trình thu thập từ này đi qua.) '' '"Hàm này trả về danh sách các từ mà đang được cung cấp độ sâu từ từ gốc trong mạng được cung cấp. '' '`` ` ### Chạy thử nghiệm Để chạy một bài kiểm tra chính thức, chỉ cần chạy tập lệnh này. `Python test.py`, mô -đun này sẽ trả về ** 0 ** nếu mọi thứ hoạt động như mong đợi. test.py sử dụng dữ liệu mẫu được cung cấp [tại đây] (https://github.com/anuragkumarak95/wordnet/tree/master/test) và thực hiện Unittest trên `find_tf_idf ()`, `find_knn () . > `Chức năng streamer` sẽ không được cung cấp theo phân phối mã này.Đó chỉ là một kịch bản độc lập với mô -đun. #### Đóng góp được hoan nghênh ở đây ! [Được xây dựng với tình yêu] (http://forthebadge.com/images/badges/built-with-love.svg) bởi [@anurag] (https://github.com/anuragkumarak95) |