Hướng dẫn an introduction to statistics with python github - giới thiệu về số liệu thống kê với python github

Permalink

bậc thầy

Chuyển nhánh/thẻ

Không thể tải các nhánh

Không có gì để hiển thị

{{refname}}

Tên đã được sử dụng

Một thẻ đã tồn tại với tên chi nhánh được cung cấp. Nhiều lệnh GIT chấp nhận cả tên thẻ và tên chi nhánh, vì vậy việc tạo nhánh này có thể gây ra hành vi bất ngờ. Bạn có chắc là bạn muốn tạo chi nhánh này?

Đi nộp

  • Đi nộp
  • Sao chép đường dẫn
  • Sao chép permalink

Không thể lấy lại những người đóng góp tại thời điểm này

4,6 MB

Tải xuống

  • Mở với máy tính để bàn
  • Tải xuống
  • Xóa tài liệu

Xin lỗi, có lỗi xảy ra. Tải lại?

Xin lỗi, chúng tôi không thể hiển thị tệp này.

Xin lỗi, tệp này không hợp lệ nên nó không thể được hiển thị.

Hướng dẫn an introduction to statistics with python github - giới thiệu về số liệu thống kê với python github

Các mô -đun Python và Notebook Ipython, đi kèm với phần giới thiệu sách về số liệu thống kê với Python

Hướng dẫn an introduction to statistics with python github - giới thiệu về số liệu thống kê với python github

REPO này chứa ba thư mục: ISP, IPYNB và IPYNB_SLIDES

"ISP": Giới thiệu về số liệu thống kê với Python

Tất cả các chương trình Python đi cùng với cuốn sách:

  • Mẫu mã (còn được gọi là Quantlets)
  • Giải pháp cho các bài tập trong cuốn sách
  • Danh sách mã, tức là các chương trình Python được in trong cuốn sách
  • Mã để tạo ra các số liệu trong cuốn sách

"IPynb": Notebook Ipython

  • Những máy tính xách tay này không được sử dụng rõ ràng trong cuốn sách và chứa các mẫu và giải pháp quan trọng cho các ứng dụng thống kê của Python.
  • Cũng chứa một thư mục cho dữ liệu được sử dụng bởi các máy tính xách tay Ipython.

"IPYNB_SLIDES"

tiết lộ.js là một ứng dụng trình bày mạnh mẽ, dựa trên CSS và HTML5. Nó tồn tại cho tất cả các nền tảng (Windows, Linux, OSX) và phải được cài đặt trên máy tính của bạn nếu bạn muốn sử dụng các slide đó.

  • Bạn có thể tự tạo các slide từ IPynb-Files, sử dụng lệnh

    Jupyter nbconvert-đến slide-Reveal-prefix ".." *.ipynb

    (Lưu ý rằng chuỗi sau "-Reveal-prefix" cho biết nơi có thể tìm thấy các thư mục tiết lộ của bạn.)

  • Hoặc bạn sao chép thư mục này (tức là ipynb_slides) vào vị trí nơi các thư mục tiết lộ của bạn và đã sẵn sàng để đi ngay lập tức.

Errata

Tệp errata.pdf chứa danh sách A các lỗi trong bản thảo và các hiệu chỉnh tương ứng.

Công bố số liệu thống kê

Lấy cảm hứng từ các cuốn sách của Allen Downey nghĩ rằng thống kê và nghĩ Bayes, đây là một nỗ lực để tìm hiểu số liệu thống kê bằng cách sử dụng phương pháp lập trình tập trung vào ứng dụng.

Khách quan

Hiển thị các ví dụ thực tế và số liệu thống kê sẽ sử dụng trong mỗi ví dụ đó. Hầu như mọi cuốn sách đều dạy một khái niệm và cho thấy một ví dụ. Cuối cùng, mọi chủ đề đều được đối xử riêng biệt và không có quan điểm toàn diện nào được trình bày. Ở đây, chúng tôi sẽ lấy ví dụ và xem làm thế nào để có ý nghĩa từ nó.

Chủ đề được bảo hiểm

  • Trung bình, trung bình, chế độ
  • Độ lệch chuẩn
  • Phương sai
  • Co-variance
  • Phân phối xác suất
  • Kiểm tra giả thuyết
  • t-test, p-giá trị, kiểm tra chi bình phương
  • Khoảng tin cậy
  • Mức độ tự tin và mức độ sigance
  • Tương quan
  • Sở lại (và sử dụng trong dữ liệu lớn)
  • Kiểm tra A/B
  • Một mô hình hồi quy tuyến tính đơn giản

Kế hoạch hội thảo

Chúng tôi sẽ sử dụng giá cần sa ở các tiểu bang khác nhau của Hoa Kỳ, cùng với dữ liệu nhân khẩu học của Hoa Kỳ dựa trên dữ liệu điều tra dân số mới nhất

Sẽ có máy tính xách tay IPYThon riêng biệt - được nhóm theo điểm tương đồng chủ đề. Notebooks sẽ được tải lên sau một số ví dụ bao gồm:

  • Tìm tổng số người mua cỏ dại trong một năm, bởi các tiểu bang khác nhau.
  • Tìm giá trị trung bình của giá trong một tuần/tháng, bởi các tiểu bang khác nhau.
  • Tìm phương sai của giá ở các quốc gia được chọn. Tìm phương sai của các trạng thái được chọn vào tuần
  • Xác định phân phối. Biểu đồ biểu đồ
  • Xác định các ngoại lệ (lô, lượng tử, lô hộp, phần trăm) trong dữ liệu giá cỏ dại
  • Phân phối liên tục (phân phối theo cấp số nhân, phân phối bình thường)
  • Giới thiệu về xác suất
  • Kiểm tra giả thuyết. Kiểm tra xem giá cỏ dại trên khắp các tiểu bang có tương tự hay không. Kiểm tra các phẩm chất khác nhau của cỏ dại
  • Lấy mẫu lại
  • Mô hình hồi quy đơn giản: Dự đoán giá cỏ dại cho tháng tới. Hiểu đầu ra và chẩn đoán
  • Giới thiệu về thử nghiệm A/B: Tác động của quy định và bãi bỏ quy định đối với một vài tiểu bang

Điều kiện tiên quyết

  • Những điều cơ bản của Python. Người dùng nên biết cách viết các chức năng; Đọc trong một tệp văn bản (CSV, TXT, FWF) và phân tích chúng; cấu trúc có điều kiện và vòng lặp; sử dụng các thư viện tiêu chuẩn như hệ điều hành, sys; Danh sách, danh sách hiểu, từ điển
  • Thật tốt khi biết những điều cơ bản của những điều sau đây:
    • Numpy
    • Scipy
    • Gấu trúc
    • Matplotlib
    • SeaBall
    • Ipython và ipython Notebook - Mọi thứ ở đây sẽ là một máy tính xách tay Ipython
  • Yêu cầu phần mềm
    • Python 2.7
    • Git - để repo này có thể được nhân bản :)
    • Virtualenv
    • Thư viện từ các yêu cầu.txt

Không bắt buộc

Người dùng có thể chọn cài đặt Anaconda, nếu họ muốn. Nếu sử dụng Anaconda hoặc Enth think, vui lòng đảm bảo rằng tất cả các thư viện được liệt kê trong các yêu cầu.txt được cài đặt.

Lưu ý cho người dùng Windows: Không chúng tôi sử dụng Windows. Từ kinh nghiệm hội thảo trong quá khứ, người dùng Windows đã phải đối mặt với các vấn đề cài đặt cách giải thích dưới đây. Nên cài đặt Anaconda và đảm bảo rằng tất cả các thư viện được liệt kê trong tệp yêu cầu.txt được cài đặt.

Hướng dẫn thiết lập

Sao chép kho lưu trữ

$ git clone https://github.com/rouseguy/intro2stats.git

Tạo một môi trường ảo & kích hoạt

$ cd intro2stats
$ virtualenv env
$ source env/bin/activate

Cài đặt reqirements từ tệp yêu cầu

$ pip install -r requirements.txt

Lưu ý: Đảm bảo bạn có thư viện cho PNG & Freetype.

Người dùng Ubuntu có thể cài đặt bên dưới

apt-get install libfreetype6-dev
apt-get install libpng-dev

Tập lệnh để kiểm tra xem cài đặt có tốt cho hội thảo không

Vui lòng thực hiện các thông tin sau tại dấu nhắc lệnh

Nếu bất kỳ thư viện nào có tin nhắn FAIL, vui lòng cài đặt/nâng cấp thư viện đó.



Giới thiệu về số liệu thống kê sử dụng Python của Bargava và Raghotham được cấp phép theo giấy phép quốc tế Creative Commons Attribution 4.0. by Bargava and Raghotham is licensed under a Creative Commons Attribution 4.0 International License.