Spaces:

xinah3131
/

youtube-trend-prediction

Sleeping

App Files Files Community

xinah3131 commited on Jun 6, 2023

Commit

e46e65a

1 Parent(s): c095d8d

Update apiSearch.py

Browse files

Files changed (1) hide show

apiSearch.py +91 -9

apiSearch.py CHANGED Viewed

@@ -4,8 +4,9 @@ from urllib.parse import urlparse, parse_qs
 from preprocessText import preprocess
 from googleapiclient.discovery import build
 import isodate
-api_keys = ['AIzaSyC4hp-RHBw5uY4NcthYw-A2fqYyrG22kaE',
     'AIzaSyC7KzwigUsNJ4KNvqGfPqXVK9QcDBsKU78',
     'AIzaSyDEPBCb1PhEaYHuBgzW6D5-ldTHUCowuq4',
     'AIzaSyD-LN8Z7xG8OHtMQ89GRDvIaRQwkVHzfEo',
@@ -16,9 +17,30 @@ api_keys = ['AIzaSyC4hp-RHBw5uY4NcthYw-A2fqYyrG22kaE',
     'AIzaSyDC744JL3Xa3eORSxORoxKpunKFPPMGb3Y',
     'AIzaSyD74KqDih_2AyOIJV-HaIvU9DdUOIyRONs',
     'AIzaSyALgq5vR27iGsuFuLiz-Ry4NGy6E-L1PUY',
-    'AIzaSyC4hp-RHBw5uY4NcthYw-A2fqYyrG22kaE']
-current_key_index = 0  # Declare current_key_index as a global variable
 def get_video_id(url):
     video_id = None
@@ -32,10 +54,6 @@ def get_video_id(url):
             video_id = query_params['v'][0]
     return video_id
-def get_next_api_key():
-    global current_key_index
-    current_key_index = (current_key_index + 1) % len(api_keys)
-    return api_keys[current_key_index]
 def get_video_metadata(video_id):
     try:
@@ -54,6 +72,10 @@ def get_video_metadata(video_id):
         # Extract the relevant metadata
         if 'items' in response and len(response['items']) > 0:
             video = response['items'][0]
             metadata = {
                 'title': video['snippet']['title'],
                 'description': video['snippet']['description'],
@@ -62,7 +84,7 @@ def get_video_metadata(video_id):
                 'duration': video['contentDetails']['duration'],
                 'views': video['statistics']['viewCount'],
                 'likes': video['statistics']['likeCount'],
-                'comments': video['statistics']['commentCount'],
                 'category_id': video['snippet']['categoryId'],
                 'thumbnail_link': video['snippet']['thumbnails']['default']['url']
             }
@@ -77,6 +99,7 @@ def get_metadata(url):
     # Set up the YouTube Data API client
     video_id = get_video_id(url)
     metadata = get_video_metadata(video_id)
     if metadata is not None:
         # Create a DataFrame from the metadata
         df = pd.DataFrame([metadata])
@@ -85,8 +108,67 @@ def get_metadata(url):
         df['cleanTitle'] = df['cleanTitle'].apply(lambda x: ' '.join(x))
         df['titleLength'] = df['title'].apply(lambda x: len(x))
         df['descriptionLength'] = df['description'].apply(lambda x: len(x))
         return df
     else:
         return 0

 from preprocessText import preprocess
 from googleapiclient.discovery import build
 import isodate
+import os
+apiKeys = [
     'AIzaSyC7KzwigUsNJ4KNvqGfPqXVK9QcDBsKU78',
     'AIzaSyDEPBCb1PhEaYHuBgzW6D5-ldTHUCowuq4',
     'AIzaSyD-LN8Z7xG8OHtMQ89GRDvIaRQwkVHzfEo',
     'AIzaSyDC744JL3Xa3eORSxORoxKpunKFPPMGb3Y',
     'AIzaSyD74KqDih_2AyOIJV-HaIvU9DdUOIyRONs',
     'AIzaSyALgq5vR27iGsuFuLiz-Ry4NGy6E-L1PUY',
+    'AIzaSyC4hp-RHBw5uY4NcthYw-A2fqYyrG22kaE'
+]
+class YouTubeService:
+    def __init__(self, api_key):
+        self.api_key = api_key
+        self.service = build('youtube', 'v3', developerKey=api_key)
+    def switch_api_key(self):
+        current_key_index = apiKeys.index(self.api_key)
+        next_key_index = (current_key_index + 1) % len(apiKeys)
+        self.api_key = apiKeys[next_key_index]
+        self.service = build('youtube', 'v3', developerKey=self.api_key)
+# Initialize the YouTube service with the first API key
+youtube = YouTubeService(apiKeys[0])
+def get_next_api_key():
+    current_key_index = apiKeys.index(youtube.api_key)
+    next_key_index = (current_key_index + 1) % len(apiKeys)
+    youtube.switch_api_key()
+    return apiKeys[next_key_index]
 def get_video_id(url):
     video_id = None
             video_id = query_params['v'][0]
     return video_id
 def get_video_metadata(video_id):
     try:
         # Extract the relevant metadata
         if 'items' in response and len(response['items']) > 0:
             video = response['items'][0]
+            try:
+                comments = video['statistics']['commentCount']
+            except KeyError:
+                comments = 0
             metadata = {
                 'title': video['snippet']['title'],
                 'description': video['snippet']['description'],
                 'duration': video['contentDetails']['duration'],
                 'views': video['statistics']['viewCount'],
                 'likes': video['statistics']['likeCount'],
+                'comments': comments,
                 'category_id': video['snippet']['categoryId'],
                 'thumbnail_link': video['snippet']['thumbnails']['default']['url']
             }
     # Set up the YouTube Data API client
     video_id = get_video_id(url)
     metadata = get_video_metadata(video_id)
     if metadata is not None:
         # Create a DataFrame from the metadata
         df = pd.DataFrame([metadata])
         df['cleanTitle'] = df['cleanTitle'].apply(lambda x: ' '.join(x))
         df['titleLength'] = df['title'].apply(lambda x: len(x))
         df['descriptionLength'] = df['description'].apply(lambda x: len(x))
+        df['thumbnail_link'] = df['thumbnail_link'].str.replace('default.jpg', 'maxresdefault.jpg')
         return df
     else:
         return 0
+def get_trending_videos(country_code):
+    try:
+        api_key = get_next_api_key()  # Replace with your own YouTube Data API key
+        youtube = build('youtube', 'v3', developerKey=api_key)
+        try:
+            response = youtube.videos().list(
+                part='snippet,contentDetails,statistics',
+                chart='mostPopular',
+                regionCode=country_code,
+                maxResults=10  # Adjust the number of videos you want to retrieve
+            ).execute()
+            trending_videos = []
+            for item in response['items']:
+                title = item['snippet']['title']
+                description = item['snippet']['description'],
+                channel_title = item['snippet']['channelTitle']
+                publish_date = item['snippet']['publishedAt']
+                duration = item['contentDetails']['duration']
+                views = item['statistics']['viewCount']
+                try:
+                    likes = item['statistics']['likeCount']
+                except KeyError:
+                    likes = "Hidden!"
+                try:
+                    comments = item['statistics']['commentCount']
+                except KeyError:
+                    comments = "Hidden!"
+                category_id = item['snippet']['categoryId']
+                thumbnail_link = item['snippet']['thumbnails']['default']['url']
+                duration = isodate.parse_duration(duration)
+                duration = duration.total_seconds()
+                trending_videos.append({
+                    'title': title,
+                    'description':description,
+                    'channel_title': channel_title,
+                    'publish_date': publish_date,
+                    'duration': duration,
+                    'views': views,
+                    'likes': likes,
+                    'comments': comments,
+                    'category_id': category_id,
+                    'thumbnail_link': thumbnail_link
+                })
+            df = pd.DataFrame(trending_videos)
+            df['views'] = df['views'].astype(int)
+            df['likes'] = df['likes'].astype(str)
+            df['comments'] = df['comments'].astype(str)
+            df['category_id'] = df['category_id'].astype(int)
+            df['thumbnail_link'] = df['thumbnail_link'].str.replace('default.jpg', 'maxresdefault.jpg')
+            return df
+        except Exception as e:
+            print('An error occurred:', str(e))
+            return None
+    except Exception as e:
+        print("An error occurred:", str(e))