Script python tăng view youtube

Trang web chia sẻ video nổi tiếng thế giới. Không có gì bí mật khi các YouTuber kiếm được nhiều tiền khi đăng video trên YouTube. Nếu bạn đang sống dưới một tảng đá, những người dùng YouTube lớn thực sự kiếm được hàng triệu đô la mỗi năm, trong khi chỉ phải đăng 1 video mỗi tuần

Điều này càng khiến mọi người muốn có một miếng bánh.

gif của andersonpaak

Mọi người và chú chó của họ hiện là YouTuber, hy vọng kiếm được nhiều tiền.
Tuy nhiên, những người này đã tham gia trò chơi muộn và đang gặp khó khăn trong việc thu hút lưu lượng truy cập vào video của họ vì nền tảng này đã bão hòa.

Trên YouTube, nhiều lượt xem hơn đồng nghĩa với nhiều tiền hơn.
Do đó, mọi người bắt đầu đặt những câu hỏi như—

  • Loại tiêu đề video nào thu hút nhiều lượt xem hơn?
  • Thể loại video nào thu hút nhiều lượt xem hơn?
  • Làm cách nào để tối ưu hóa các thẻ video của tôi để thu hút nhiều lượt xem hơn?

Bạn thật may mắn, hôm nay chúng tôi sẽ giải đáp chúng.
Trong bài viết này, chúng tôi sẽ thực hiện một số phân tích dữ liệu khám phá về một số dữ liệu video trên YouTube từ Hoa Kỳ, trích xuất bất kỳ thông tin chi tiết nào mà chúng tôi có thể nhận được.

điều kiện tiên quyết

EDA chúng tôi sẽ thực hiện hôm nay chủ yếu sử dụng Plotly. Điều quan trọng là bạn hiểu các nguyên tắc cơ bản của việc xây dựng Đồ thị Plotly đơn giản. Tôi đã viết về cách xây dựng đồ thị Plotly cơ bản ở đây, bao gồm các khái niệm bạn cần hiểu khi xây dựng bất kỳ loại đồ thị nào

Python cho Khoa học dữ liệu — Hướng dẫn trực quan hóa dữ liệu với Plotly

Đã đến năm 2020, đã đến lúc ngừng sử dụng Matplotlib và Seaborn

hướng tới khoa học dữ liệu. com

Để làm việc với Plotly, bạn thường cần chuyển đổi dữ liệu bằng Pandas. tôi đã bảo vệ bạn. Tôi tình cờ cũng đã viết Hướng dẫn về gấu trúc

Python cho Khoa học dữ liệu — Hướng dẫn về Pandas

Hướng dẫn khám phá dữ liệu hoàn chỉnh trong 10 phút

hướng tới khoa học dữ liệu. com

Khi bạn hiểu cả Plotly và Pandas, bạn đã sẵn sàng để thực hiện hầu hết mọi loại phân tích dữ liệu khám phá. Tôi sẽ gọi cả hai thư viện này là bánh mì và bơ của tôi về phân tích và trực quan hóa dữ liệu

nhập khẩu

Làm việc với Máy tính xách tay Jupyter…

# To manipulate data, NLP and visualizations
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
import os
from subprocess import check_output
# Standard plotly imports
import plotly as py
import plotly.tools as tls
from plotly.offline import iplot, init_notebook_mode
import plotly.graph_objs as go
import cufflinks
# Using plotly + cufflinks in offline mode
init_notebook_mode[connected=True]
cufflinks.go_offline[connected=True]
# To interactive buttons
import ipywidgets as widgets
from ipywidgets import interact, interact_manual
import warnings
warnings.filterwarnings["ignore"]
#nlp
import string
import re #for regex
import nltk
from nltk.corpus import stopwords
import spacy
from nltk import pos_tag
from nltk.stem.wordnet import WordNetLemmatizer
from nltk.tokenize import word_tokenize
from nltk.tokenize import TweetTokenizer
from wordcloud import WordCloud, STOPWORDS

Bây giờ có rất nhiều hàng nhập khẩu, nhưng tôi hứa chúng là cần thiết

Nguồn dữ liệu

Ảnh chụp màn hình của tác giả

Bộ dữ liệu được nhập từ Kaggle. com. Nó được đặt tên là Trending YouTube Video Statistics và nó có dữ liệu từ nhiều quốc gia. Với mục đích của dự án thú cưng này, chúng tôi sẽ chỉ phân tích dữ liệu từ Hoa Kỳ

Ghi chú. Dữ liệu đang được trích xuất thông qua API YouTube. Do đó, bạn cũng có thể trích xuất dữ liệu của riêng mình cho các quốc gia cụ thể và các khung thời gian khác nhau. Tất cả thông tin trong nguồn

Nhập tập dữ liệu
df = pd.read_csv[filepath]

Trong phân tích dữ liệu khám phá này, chúng tôi hướng đến -

  • Hiểu rõ hơn về tập dữ liệu
  • Tìm hiểu xem các lượt xem có khác nhau theo danh mục video không
  • Tìm hiểu xem chất lượng của tiêu đề video có ảnh hưởng đến lượt xem không

Hãy bắt đầu bằng cách hiểu các biến trong dữ liệu của chúng tôi

#Looking for Null values and the types of our data
df.info[]
df.head[]

Hình ảnh của tác giả

Hình ảnh của tác giả

Nhìn vào các cột, chúng tôi sẽ tập trung vào các chế độ xem trong dự án này.
Hãy cùng tìm hiểu sự phân bổ lượt xem.

df[['views']].iplot[kind="histogram", 
bins=50, theme="white",
histnorm='probability',
title="Distribuition of Views",
xTitle='Distribution',
yTitle='Probability']

Ghi âm của tác giả

Chỉ riêng trên biểu đồ này, chúng tôi có thể nói rằng hầu hết các video đều có ít hơn 5 triệu lượt xem. Ngoài ra còn có rất nhiều ngoại lệ, đây có lẽ là những video lan truyền. Chúng ta hãy xem phân phối mà không có ngoại lệ

def RemoveOutliers[df_num]: 
# calculating mean and std of the array
data_mean, data_std = np.mean[df_num], np.std[df_num]
# setting the threshold value
threshold = data_std * 3
#setting lower and upper limit
lower, upper = data_mean - threshold, data_mean + threshold
# array without outlier values
outliers_removed = [x for x in df_num if x > lower and x < upper]
return outliers_removed
df['removed_views_outliers'] = RemoveOutliers[df['views']]
df['removed_views_outliers'].iplot[kind="histogram",
bins=100, theme="white",
histnorm='probability',
title= "Distribution of Views Without Outliers",
xTitle='Distribution',
yTitle='Probability']

Ghi âm của tác giả

Gần 40% video có ít hơn 200 nghìn lượt xem và ngày càng khó đạt được lượt xem sau mốc 200 nghìn

Danh mục video

Không có gì bí mật khi một số danh mục nhất định nhận được nhiều lượt xem hơn những danh mục khác.
Hãy cùng khám phá các danh mục video hiện có cũng như tần suất video được đăng trong mỗi danh mục đó.

rename_channels = {1:'Film/Animation', 2:'Cars/Vehicles', 10:'Music', 15:'Pets/Animals',
17:'Sport',19:'Travel/Events',20: 'Gaming',22:'People/Blogs',23:'Comedy',
24:'Entertainment',25:'News/Politics',26:'How to/Style',27:'Education',
28:'Science/Technology',29:'Non Profits/Activism'}
df['category_name'] = np.nan
df['category_name'] = df['category_id'].map[rename_channels]
percent_category = round[df["category_name"].value_counts[], 2]
categories = round[df["category_name"].value_counts[] / len[df["category_name"]] * 100,2]
labels = list[categories.index]
values = list[categories.values]
trace1 = go.Pie[labels=labels,
values=values,
marker=dict[colors=['red']],
text=[percent_category.index.map[str]],
hovertext=[percent_category.values.astype[str]]]
layout = go.Layout[title="Views by Category",
legend=dict[orientation="h"]];
fig = go.Figure[data=[trace1], layout=layout]
iplot[fig]

Ghi âm của tác giả

Có vẻ như 3 danh mục hàng đầu có nhiều video nhất là —

  • Giải trí
  • Âm nhạc
  • Cách tạo kiểu

Đây là kiến ​​thức quan trọng để chúng tôi hiểu được sự cạnh tranh của mình nếu chúng tôi đăng bài trong bất kỳ danh mục nào trong số này. Trong danh mục Âm nhạc và Giải trí, phần lớn các video được đăng bởi những người nổi tiếng hoặc công ty giải trí chứ không phải 'Người dùng YouTube'. Do đó, sẽ hợp lý khi chất lượng và số lượng đầu ra video của họ vượt xa bất kỳ ai trong chúng ta.

Chúng tôi biết những danh mục này có nhiều video nhất nhưng chúng có nhiều lượt xem nhất không?

trace1 = go.Bar[x=df.groupby[['category_name']]['views'].sum[].index,
y=df.groupby[['category_name']]['views'].sum[].values,
name='Total Views by Category', visible=True]
trace2 = go.Bar[x=df.groupby[['category_name']]['channel_title'].nunique[].index,
y=df.groupby[['category_name']]['channel_title'].nunique[].values,
name='Unique Channels by Category', visible=False]
data = [trace1, trace2]updatemenus = list[[
dict[active=-1,
showactive=True,
buttons=list[[
dict[
label = 'Total Views by Category',
method = 'update',
args = [{'visible': [True, False, False]},
{'title': 'Sum of views by Category'}]],

dict[
label = 'Total Channels by Category',
method = 'update',
args = [{'visible': [False, True, False]},
{'title': 'Total Channels by Category'}]],
]],
]
]]
layout = dict[title='Different Metrics by each category
Sum of views by Category',
showlegend=False,
updatemenus=updatemenus]
fig = dict[data=data, layout=layout]iplot[fig]

Ghi âm của tác giả

Các danh mục Âm nhạc và Giải trí có nhiều lượt xem và kênh nhất. Một sự thật thú vị là ngay cả khi có nhiều video được đăng trong danh mục Âm nhạc, thì vẫn có nhiều kênh trong danh mục Giải trí hơn Âm nhạc. Điều này có nghĩa là danh mục Giải trí bão hòa hơn một chút so với Âm nhạc

Về chủ đề bão hòa, hãy khám phá thêm

#saturation metrics by category
views_list = np.array[df.groupby[['category_name']]['views'].sum[].tolist[]]
channels_list = np.array[df.groupby[['category_name']]['channel_title'].nunique[].tolist[]]
videos_list = np.array[df.groupby[['category_name']]['title'].nunique[].tolist[]]
views_by_videos = views_list/videos_list
views_by_channels = views_list/channels_list

Chúng tôi tạo ra các số liệu mới —

  • lượt xem_theo_video
  • lượt xem_theo_kênh

để xem mỗi video và kênh nhận được bao nhiêu lượt xem theo danh mục.
Bằng cách này, chúng tôi có thể đánh giá sơ bộ mức độ bão hòa của một danh mục nhất định.

Khi bắt đầu với tư cách là YouTuber, chúng tôi không muốn tham gia danh mục video bão hòa. Trừ khi bạn có một lợi thế cực kỳ không công bằng, nếu không, sẽ là khôn ngoan nếu bạn tham gia vào các danh mục chào đón người mới hơn. Hãy tưởng tượng cạnh tranh với những người như 'Justin Bieber' trong Âm nhạc, không phải là một kết thúc tốt đẹp

Hãy hiển thị Saturation Metrics trên một biểu đồ

________số 8

Ghi âm của tác giả

Từ các biểu đồ, chúng ta có thể thấy rằng âm nhạc vẫn dẫn đầu về lượt xem trên mỗi video và lượt xem trên mỗi kênh. Tuy nhiên, xếp thứ hai là danh mục Phi lợi nhuận/Hoạt động có số lượng cao thứ hai về cả lượt xem trên mỗi video và lượt xem trên mỗi kênh. Nhìn vào biểu đồ trước, số lượng video và kênh trong Phi lợi nhuận/Hoạt động giữ một trong những con số thấp nhất trong cả hai số lượng

Điều này có nghĩa là danh mục có ít video và kênh nhất nhưng lại có lượt xem cao nhất trên mỗi video và kênh. Do đó, đây sẽ là một danh mục lý tưởng để tham gia

Nếu được chọn một, tôi sẽ chọn thể loại Phim/Hoạt hình. Nhìn vào dữ liệu, nó không có quá nhiều video và kênh, nhưng số lượt xem trên mỗi video và số lượt xem trên mỗi kênh là rất cao. Ngoài ra, hoạt hình là lĩnh vực tôi quan tâm nên đó là một điểm cộng

tiêu đề video

Bây giờ chúng ta đã chọn một danh mục, đã đến lúc khám phá tiêu đề video.
Như nhiều người dùng YouTube đã đề cập, tiêu đề và hình thu nhỏ của video rất quan trọng.

Bạn có thể có một video được làm rất tốt. Nếu không có tiêu đề và hình thu nhỏ video hay, sẽ không có ai nhấp vào video đó — mọi YouTuber đều từng

Do đó, hãy đảm bảo rằng tiêu đề video của chúng ta được tối ưu hóa để thu được nhiều lượt xem hơn.
Trước tiên, hãy xem số lượng từ trong tiêu đề và thẻ
và cách nó ảnh hưởng đến quan điểm của chúng ta.

#Unique word count
df['count_unique_word']=df["title"].apply[lambda x: len[set[str[x].split[]]]]
df['count_unique_word_tags']=df["tags"].apply[lambda x: len[set[str[x].split[]]]]
df[['count_unique_word_tags','count_unique_word']].iplot[kind="histogram",bins=50, theme="white", histnorm='probability', title="Distribuitions of Word Count in Title and Tags",
xTitle='Distribuition',
yTitle='Probability']

Ghi âm của tác giả

Xem xét sự phân bố của số lượng từ.
Đối với tiêu đề video, có vẻ như phần lớn tiêu đề video có từ 5 đến 10 từ. Đối với thẻ video, phần lớn thẻ video có ít hơn 30 từ.

Chúng ta có thể coi đây là một tài liệu tham khảo. Hãy xem nó ảnh hưởng đến lượt xem như thế nào

df = pd.read_csv[filepath]
0

Ghi âm của tác giả

Hấp dẫn. Đối với số từ trong tiêu đề video, tiêu đề có 2 từ nhận được nhiều lượt xem nhất. Sau đó, cứ tăng số lượng từ thì lượt xem cũng tăng theo cho đến khi đạt 11 từ thì lượt xem bắt đầu đi ngang. Điều này sẽ đề xuất độ dài tiêu đề video của chúng tôi là 2 từ hoặc bất kỳ đâu trong khoảng từ 5 đến 10 từ

Đối với số từ trong thẻ video, các video có thẻ từ 25 từ trở xuống có số lượt xem gần như giống nhau. Lượt xem bắt đầu cao nhất ở khoảng từ 26 đến 34 thẻ từ, sau đó lượt xem bắt đầu giảm dần

thứ khá thú vị

Nội dung Tiêu đề/Thẻ Video

Bây giờ chúng tôi đã biết đại khái độ dài của tiêu đề và thẻ video của mình, chúng tôi muốn biết nên đặt loại từ nào vào đó. Bằng cách khám phá nội dung từ ngữ, chúng ta có thể biết sơ bộ loại từ nào mà các Youtuber khác đưa vào video của họ. Chúng ta có thể dùng từ cloud plot để hình dung rõ ràng những từ này

df = pd.read_csv[filepath]
1

Ảnh chụp màn hình của Tác giả
df = pd.read_csv[filepath]
2

Ảnh chụp màn hình của tác giả

Đối với tiêu đề video, chúng ta có thể thấy rằng từ được nhắc đến nhiều nhất là 'MUỐN' và 'NÓI'. Có một lý do mà những từ này xuất hiện nhiều nhất, chúng ta sẽ phải khám phá thêm để hiểu rõ hơn về dữ liệu

Đối với các thẻ video, chúng ta có thể thấy rằng từ được đưa ra nhiều nhất là 'TUYỆT VỜI', 'CUỐI CÙNG', 'CUỘC SỐNG' và 'TUẦN'. Đây là những từ khá chung chung. Một lần nữa, chúng ta sẽ phải phân tích sâu hơn để hiểu dữ liệu này

Mã cho dự án

ý chính của tác giả

Phần kết luận

Ảnh của Mathieu Stern trên Bapt

Nếu bạn đã đọc đến đây, bạn phải thực sự muốn kiếm được số tiền Youtube đó.
Nếu đúng như vậy, bạn chỉ cần làm theo các hướng dẫn này trên Hành trình Youtube của mình và bạn sẽ sẵn sàng cho cuộc sống.

  • Tạo video trong danh mục Phim/Hoạt hình
  • Có tiêu đề video gồm 2 từ hoặc từ 5 đến 10 từ
  • Có từ 26 đến 34 thẻ video
  • MUỐN và NÓI được đưa vào nhiều nhất trong tiêu đề video — hãy tìm hiểu lý do tại sao
  • TUYỆT VỜI, CUỐI CÙNG, CUỘC SỐNG và TUẦN được đưa vào thẻ video nhiều nhất — hãy tìm hiểu lý do tại sao

Nếu bạn chưa ở trên cùng một trang, dữ liệu này rõ ràng chỉ đóng vai trò tham khảo và không có bằng chứng nào mang lại cho bạn nhiều lượt xem hơn. Đây là phân tích thăm dò trên một phần nhỏ dữ liệu YouTube từ Hoa Kỳ, có nghĩa là nó sẽ không hiển thị chính xác hành vi của các lượt xem ở bất kỳ đâu, kể cả Hoa Kỳ

Tôi hy vọng điều này ít nhất mang lại niềm vui cho bạn, cũng như cho tôi.
Hẹn gặp lại bạn trong phần tiếp theo.

Đăng ký nhận bản tin của tôi để giữ liên lạc

Chúng tôi vẫn chưa hoàn thành hành trình dữ liệu của mình. Tôi đang làm thêm nhiều câu chuyện, bài viết và hướng dẫn về ngành dữ liệu. Bạn hoàn toàn có thể mong đợi nhiều bài viết như thế này. Trong thời gian chờ đợi, vui lòng xem các bài viết khác của tôi để tạm thời lấp đầy cơn đói dữ liệu của bạn

Như thường lệ, tôi kết thúc bằng một trích dẫn

Dữ liệu là khoa học mới. Dữ liệu lớn nắm giữ câu trả lời. ~ Pat Gelsinger, Giám đốc điều hành, VMware

Cảm ơn vì đã đọc. Nếu bạn muốn liên lạc với tôi, vui lòng liên hệ với tôi qua nickmydata@gmail. com hoặc Hồ sơ LinkedIn của tôi. Bạn cũng có thể xem mã cho các lần ghi trước trong Github của tôi

Bạn có thể tự động hóa lượt xem trên YouTube không?

Tự động hóa YouTube có thể giúp bạn có thêm lượt xem và người đăng ký , kiếm nhiều tiền hơn và tiết kiệm rất nhiều thời gian. Một số hành động của YouTube bao gồm tự động gửi email với video mới của bạn, tạo bản ghi âm, tạo tiêu đề và mô tả thân thiện với SEO, quảng cáo video trên mạng xã hội, v.v.

Bí quyết để có được nhiều lượt xem trên YouTube là gì?

—tạo một danh sách phát để tổng hợp chúng để những người xem quan tâm có thể theo dõi tất cả. .
Quảng cáo video YouTube của bạn trên tất cả các kênh truyền thông xã hội của bạn. .
Yêu cầu người xem đăng ký kênh của bạn. .
Bật tính năng nhúng. .
Tăng thời gian xem. .
Phiên âm video của bạn. .
Đăng video của bạn vào đúng thời điểm

Làm YouTube bằng trăn như thế nào?

Bước 1. Thiết lập dự án và thông tin đăng nhập của bạn. Tạo hoặc chọn dự án trong Bảng điều khiển API. .
Bước 2. Thiết lập và chạy mẫu. Sử dụng tiện ích Trình khám phá API trong bảng điều khiển bên để lấy mã mẫu để truy xuất thông tin về kênh YouTube GoogleDevelopers. .
Bước 3. Chạy một yêu cầu được ủy quyền

Chủ Đề