commit

1 year ago · beae493df0
48 changed files with 1511 additions and 1 deletions
--- a/README.md
+++ b/README.md
@ -1,2 +1,3 @@
-# youtube_prod
+# youtube_srt

+Youtube字幕项目
--- a/db/youtube_prod.db
+++ b/db/youtube_prod.db
--- a/db/youtube_prod_bak.db
+++ b/db/youtube_prod_bak.db
--- a/download/ChannelService.py
+++ b/download/ChannelService.py
@ -0,0 +1,7 @@
+import json
+from Orm import Channel
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+class ChannelService:
+    def getOneByChannelId(channelId):
+        return Channel.get_or_none(Channel.channelId == channelId)
--- a/download/Contant.py
+++ b/download/Contant.py
@ -0,0 +1,2 @@
+db=""
+logDir=""
--- a/download/DownloadInfoService.py
+++ b/download/DownloadInfoService.py
@ -0,0 +1,28 @@
+from Orm import DownloadInfo
+
+
+class DownloadService:
+    def getOneByVideoId(videoId, downloadType):
+        return DownloadInfo.get(DownloadInfo.videoId == videoId, DownloadInfo.downloadType == downloadType)
+
+    def createOne(videoId, downloadType, tryTime, isFinished):
+        DownloadInfo.create(
+            videoId=videoId,
+            downloadType=downloadType,
+            tryTime=tryTime,
+            isFinished=isFinished
+        )
+
+    def updateInfoByVideoId(videoId, tryTime, isFinished, downloadType):
+        DownloadInfo.update(tryTime=tryTime, isFinished=isFinished).where(
+            DownloadInfo.videoId == videoId, DownloadInfo.downloadType == downloadType).execute()
+
+    def findNotFinishList():
+        return DownloadInfo.select().where(DownloadInfo.isFinished == 0, DownloadInfo.tryTime <= 5, DownloadInfo.downloadType == 1).limit(10).execute()
+
+    def changeDownloadType(videoId, tryTime, isFinished, downloadType, changeType):
+        DownloadInfo.update(tryTime=tryTime, isFinished=isFinished, downloadType=changeType).where(
+            DownloadInfo.videoId == videoId, DownloadInfo.downloadType == downloadType).execute()
+
+    def findNotFinishListTwo():
+        return DownloadInfo.select().where(DownloadInfo.isFinished == 0, DownloadInfo.tryTime <= 5, DownloadInfo.downloadType == 2).limit(10).execute()
--- a/download/DownloadUtil.py
+++ b/download/DownloadUtil.py
@ -0,0 +1,172 @@
+from shutil import copyfile
+from youtube_transcript_api import YouTubeTranscriptApi
+from youtube_transcript_api.formatters import SRTFormatter
+from VideoService import VideoService
+from ChannelService import ChannelService
+from DownloadInfoService import DownloadService
+from LoggerUtils import Logger
+import time
+import os
+from func_timeout import func_set_timeout
+import operator
+
+
+class DownLoadUtil:
+
+    formatter = SRTFormatter()
+    proxies = {"http": "http://127.0.0.1:7890",
+               "https": "https://127.0.0.1:7890"}
+
+    @func_set_timeout(60)
+    def downloadOne(videoId):
+        # 获取数据
+        video = VideoService.getOneByVideoId(videoId)
+        channel = ChannelService.getOneByChannelId(str(video.channelId))
+        # 格式化title
+        videoTitle = str(video.videoTitle)
+        videoTitle = str(videoTitle).replace("/", u"\u2215")
+        videoTitle = str(videoTitle).replace("?", "？")
+        videoTitle = str(videoTitle).replace("\\", "")
+        videoTitle = str(videoTitle).replace("|", "")
+        videoTitle = str(videoTitle).replace("<", "")
+        videoTitle = str(videoTitle).replace(">", "")
+        videoTitle = str(videoTitle).replace(":", "")
+        # 获取发布时间
+        videoPublishTime = str(video.videoPublishTime)
+        videoPublishTime = str(videoPublishTime).split("T")[0]
+        # 开始下载
+        Logger.info("开始下载...{}".format(videoId))
+        cpPath = ""
+        try:
+            # 获取字幕
+            languages = str(video.videoLanguage)
+            storePath = "/mnt/srt_file/" + str(channel.channelTitle)
+            cpPath = "/mnt/tmp_srt_file/" + str(channel.channelTitle)
+            if not os.path.exists(storePath):
+                Logger.info("开始创建文件夹:" + storePath)
+                os.makedirs(storePath)
+            if not os.path.exists(cpPath):
+                Logger.info("开始创建文件夹:" + cpPath)
+                os.makedirs(cpPath)
+            storePath = storePath + "/" + videoPublishTime + \
+                "-" + languages + "-" + videoTitle + ".srt"
+            cpPath = cpPath + "/" + videoPublishTime + \
+                "-" + languages + "-" + videoTitle + ".srt"
+            if len(cpPath) > 120:
+                storePath = storePath[:-20] + ".srt"
+                cpPath = cpPath[:-20] + ".srt"
+            videoSrt = YouTubeTranscriptApi.get_transcript(
+                videoId, languages=[languages])
+            srt_formatted = DownLoadUtil.formatter.format_transcript(videoSrt)
+            Logger.info("文件地址...{}".format(storePath))
+            with open(storePath, 'w', encoding='utf-8') as srt_file:
+                srt_file.write(srt_formatted)
+            Logger.info("下载完成...{}".format(videoId))
+            copyfile(storePath, cpPath)
+            # 修改video数据
+            VideoService.updateIsDownloadByVideoId(videoId, 1)
+            # 修改downloadInfo
+            downloadInfo = DownloadService.getOneByVideoId(videoId, 1)
+            if downloadInfo is not None:
+                DownloadService.updateInfoByVideoId(
+                    videoId, downloadInfo.tryTime + 1, 1, 1)
+        except Exception as e:
+            Logger.error("下载失败...{}".format(videoId))
+            logStr = "Exception...{}".format(e)
+            Logger.error(logStr)
+            downloadInfo = DownloadService.getOneByVideoId(videoId, 1)
+            if operator.contains(logStr, "No transcripts"):
+                Logger.error("VideoId:{},不存在字幕文件".format(videoId))
+                if downloadInfo is not None:
+                    DownloadService.changeDownloadType(
+                        videoId, 0, 0, 1, 2)
+            elif operator.contains(logStr, "File name too long"):
+                # 文件名过长
+                languages = str(video.videoLanguage)
+                videoSrt = YouTubeTranscriptApi.get_transcript(
+                    videoId, languages=[languages])
+                srt_formatted = DownLoadUtil.formatter.format_transcript(videoSrt)
+                storePath = "/mnt/srt_file/" + str(channel.channelTitle) + "/" + \
+                    videoPublishTime + "-" + languages + "-" + videoId + ".srt"
+                cpPath = "/mnt/tmp_srt_file/" + str(channel.channelTitle) + "/" + \
+                    videoPublishTime + "-" + languages + "-" + videoId + ".srt"
+                if len(cpPath) > 120:
+                    storePath = storePath[:-20] + ".srt"
+                    cpPath = cpPath[:-20] + ".srt"
+                Logger.info("文件名过长,文件地址...{}".format(storePath))
+                with open(storePath, 'w', encoding='utf-8') as srt_file:
+                    srt_file.write(srt_formatted)
+                Logger.info("下载完成...{}".format(videoId))
+                copyfile(storePath, cpPath)
+                # 修改video数据
+                VideoService.updateIsDownloadByVideoId(videoId, 1)
+                # 修改downloadInfo
+                downloadInfo = DownloadService.getOneByVideoId(videoId, 1)
+                if downloadInfo is not None:
+                    DownloadService.updateInfoByVideoId(
+                        videoId, downloadInfo.tryTime + 1, 1, 1)
+            else:
+                if downloadInfo is not None:
+                    Logger.info("VideoId:{}开始重试第{}次".format(
+                        videoId, downloadInfo.tryTime + 1))
+                    DownloadService.updateInfoByVideoId(
+                        videoId, downloadInfo.tryTime + 1, 0, 1)
+
+    @func_set_timeout(60)
+    def downloadTwo(videoId):
+        # 获取数据
+        video = VideoService.getOneByVideoId(videoId, 2)
+        channel = ChannelService.getOneByChannelId(str(video.channelId))
+        # 格式化title
+        videoTitle = str(video.videoTitle)
+        videoTitle = str(videoTitle).replace("/", u"\u2215")
+        videoTitle = str(videoTitle).replace("?", "？")
+        videoTitle = str(videoTitle).replace("\\", "")
+        videoTitle = str(videoTitle).replace("|", "")
+        videoTitle = str(videoTitle).replace("<", "")
+        videoTitle = str(videoTitle).replace(">", "")
+        videoTitle = str(videoTitle).replace(":", "")
+        # 获取发布时间
+        videoPublishTime = str(video.videoPublishTime)
+        videoPublishTime = str(videoPublishTime).split("T")[0]
+        # 开始下载
+        Logger.info("开始下载...{}".format(videoId))
+        try:
+            # 获取字幕
+            languages = str(video.videoLanguage)
+            storePath = "./download/" + str(channel.channelTitle)
+            if not os.path.exists(storePath):
+                Logger.info("开始创建文件夹:" + storePath)
+                os.makedirs(storePath)
+            storePath = storePath + "\\" + videoPublishTime + \
+                "-" + languages + "-" + videoTitle + ".srt"
+            videoSrt = YouTubeTranscriptApi.get_transcript(
+                videoId, languages=[languages])
+            srt_formatted = DownLoadUtil.formatter.format_transcript(videoSrt)
+            Logger.info("文件地址...{}".format(storePath))
+            with open(storePath, 'w', encoding='utf-8') as srt_file:
+                srt_file.write(srt_formatted)
+            Logger.info("下载完成...{}".format(videoId))
+            # 修改video数据
+            VideoService.updateIsDownloadByVideoId(videoId, 1)
+            # 修改downloadInfo
+            downloadInfo = DownloadService.getOneByVideoId(videoId, 2)
+            if downloadInfo is not None:
+                DownloadService.updateInfoByVideoId(
+                    videoId, downloadInfo.tryTime + 1, 1, 2)
+        except Exception as e:
+            Logger.error("下载失败...{}".format(videoId))
+            logStr = "Exception...{}".format(e)
+            Logger.error(logStr)
+            downloadInfo = DownloadService.getOneByVideoId(videoId, 2)
+            if operator.contains(logStr, "No transcripts"):
+                Logger.error("VideoId:{},不存在字幕文件".format(videoId))
+                if downloadInfo is not None:
+                    DownloadService.changeDownloadType(
+                        videoId, 6, 0, 2, 3)
+            else:
+                if downloadInfo is not None:
+                    Logger.info("VideoId:{}开始重试第{}次".format(
+                        videoId, downloadInfo.tryTime + 1))
+                    DownloadService.updateInfoByVideoId(
+                        videoId, downloadInfo.tryTime + 1, 0, 2)
--- a/download/LoggerUtils.py
+++ b/download/LoggerUtils.py
@ -0,0 +1,6 @@
+from loguru import logger
+import Contant
+Logger = logger
+def initLogger():
+    logger.add(Contant.logDir+"/download_{time}.log", rotation="500MB", encoding="utf-8",
+           enqueue=True, compression="zip", retention="10 days")
--- a/download/Orm.py
+++ b/download/Orm.py
@ -0,0 +1,65 @@
+from peewee import *
+import Contant
+import argparse
+from LoggerUtils import Logger
+
+parser = argparse.ArgumentParser(description='')
+parser.add_argument('--db', type=str, default='')
+parser.add_argument('--logDir', type=str, default='')
+args = parser.parse_args()
+Contant.db = args.db
+db = SqliteDatabase(Contant.db)
+
+
+def ormInit():
+    Channel.create_table()
+    Video.create_table()
+    DownloadInfo.create_table()
+
+
+class BaseModel(Model):
+    class Meta:
+        database = db
+
+# 频道信息
+
+
+class Channel(BaseModel):
+    id = PrimaryKeyField()
+    channelId = CharField(null=False)
+    channelTitle = CharField(null=False)
+    channelLanguage = CharField()
+    channelReptileTime = CharField(null=True)
+
+    class Meta:
+        db_table = 'Channel'
+
+# 视频信息
+
+
+class Video(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField(null=False)
+    channelId = CharField(null=False)
+    videoTitle = CharField()
+    videoLen = IntegerField()
+    videoType = CharField()
+    videoPublishTime = CharField()
+    videoLanguage = CharField()
+    isDownload = IntegerField()
+
+    class Meta:
+        db_table = 'Vidoes'
+
+# 下载信息
+
+
+class DownloadInfo(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField()
+    downloadType = IntegerField()
+    tryTime = IntegerField()
+    isFinished = IntegerField()
+
+    class Meta:
+        db_table = 'Download_info'
--- a/download/VideoService.py
+++ b/download/VideoService.py
@ -0,0 +1,26 @@
+import json
+from Orm import Video
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+
+class VideoService:
+    def getOneByVideoId(videoId):
+        return Video.get_or_none(Video.videoId == videoId)
+
+    def createOne(videoId, channelId, videoTitle, videoLen, videoType, videoPublishTime, videoLanguage, isDownload):
+        Video.create(videoId=videoId,
+                     channelId=channelId,
+                     videoTitle=videoTitle,
+                     videoLen=videoLen,
+                     videoType=videoType,
+                     videoPublishTime=videoPublishTime,
+                     videoLanguage=videoLanguage,
+                     isDownload=isDownload)
+
+    def updateLenByVideoId(videoId, len):
+        Video.update(videoLen=len).where(Video.videoId == videoId).execute()
+
+    def updateIsDownloadByVideoId(videoId, isDownload):
+        Video.update(isDownload=isDownload).where(
+            Video.videoId == videoId).execute()
+        
--- a/download/download.zip
+++ b/download/download.zip
--- a/download/main_download.py
+++ b/download/main_download.py
@ -0,0 +1,49 @@
+import argparse
+import random
+import time
+import Contant
+from LoggerUtils import Logger, initLogger
+import Orm
+from VideoService import VideoService
+from ChannelService import ChannelService
+from DownloadInfoService import DownloadService
+from DownloadUtil import DownLoadUtil
+from func_timeout import func_set_timeout
+import func_timeout
+import requests
+
+# python3 ./main_download.py --db="../db/youtube_prod.db" --logDir="./logs"
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description='')
+    parser.add_argument('--db', type=str, default='')
+    parser.add_argument('--logDir', type=str, default='')
+    args = parser.parse_args()
+    Contant.db = args.db
+    Contant.logDir = args.logDir
+    initLogger()
+    Orm.ormInit()
+    list = DownloadService.findNotFinishList()
+    Logger.info("list size:{}".format(len(list)))
+    while (len(list) > 0):
+        for info in list:
+            try:
+                DownLoadUtil.downloadOne(info.videoId)
+                restTime = random.randint(1, 3)
+                Logger.info("间隔{}秒后继续...".format(restTime))
+                time.sleep(restTime)
+            except func_timeout.exceptions.FunctionTimedOut as e:
+                Logger.error("执行下载方法超时错误:{}".format(e))
+        loopRestTime = random.randint(1, 3)
+        Logger.info("循环间隔{}秒后继续...".format(loopRestTime))
+        time.sleep(loopRestTime)
+        list = DownloadService.findNotFinishList()
+    # 发送钉钉消息
+    webhook = "https://oapi.dingtalk.com/robot/send?access_token=c8c8d7d42c4eecd449dd303025ef968f647d1d8e8694e3fabc0ab5770d646dcb"
+    jsonData = {
+        "msgtype": "text",
+        "text": {
+            "content": "[Youtube]download finished"
+        }
+    }
+    requests.post(webhook, json=jsonData)
+    Logger.info("download发送钉钉消息成功...")
--- a/init/Contant.py
+++ b/init/Contant.py
@ -0,0 +1,2 @@
+db=""
+logDir=""
--- a/init/LoggerUtils.py
+++ b/init/LoggerUtils.py
@ -0,0 +1,6 @@
+from loguru import logger
+import Contant
+Logger = logger
+def initLogger():
+    logger.add(Contant.logDir+"/init_{time}.log", rotation="500MB", encoding="utf-8",
+           enqueue=True, compression="zip", retention="10 days")
--- a/init/Orm.py
+++ b/init/Orm.py
@ -0,0 +1,65 @@
+from peewee import *
+import Contant
+import argparse
+from LoggerUtils import Logger
+
+parser = argparse.ArgumentParser(description='')
+parser.add_argument('--db', type=str, default='')
+parser.add_argument('--logDir', type=str, default='')
+args = parser.parse_args()
+Contant.db = args.db
+db = SqliteDatabase(Contant.db)
+
+
+def ormInit():
+    Channel.create_table()
+    Vidoe.create_table()
+    DownloadInfo.create_table()
+
+
+class BaseModel(Model):
+    class Meta:
+        database = db
+
+# 频道信息
+
+
+class Channel(BaseModel):
+    id = PrimaryKeyField()
+    channelId = CharField(null=False)
+    channelTitle = CharField(null=False)
+    channelLanguage = CharField()
+    channelReptileTime = CharField(null=True)
+
+    class Meta:
+        db_table = 'Channel'
+
+# 视频信息
+
+
+class Vidoe(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField(null=False)
+    channelId = CharField(null=False)
+    videoTitle = CharField()
+    videoLen = IntegerField()
+    videoType = CharField()
+    videoPublishTime = CharField()
+    videoLanguage = CharField()
+    isDownload = IntegerField()
+
+    class Meta:
+        db_table = 'Vidoes'
+
+# 下载信息
+
+
+class DownloadInfo(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField()
+    downloadType = IntegerField()
+    tryTime = IntegerField()
+    isFinished = IntegerField()
+
+    class Meta:
+        db_table = 'Download_info'
--- a/init/init.py
+++ b/init/init.py
@ -0,0 +1,56 @@
+from LoggerUtils import Logger, initLogger
+import argparse
+import Contant
+from Orm import ormInit, Channel
+import operator
+from bs4 import BeautifulSoup as bs
+from urllib.request import urlopen, Request
+
+# py .\init.py --db=../db/youtube_prod.db --logDir=./logs
+def saveChannel(channelUrl, language):
+    Logger.info("频道链接:"+channelUrl)
+    channelId = ""
+    channelName = ""
+    url_opener = urlopen(
+        Request(channelUrl, headers={'User-Agent': 'Mozilla'}))
+    videoInfo = bs(url_opener, features="html.parser")
+    links = videoInfo.find_all("link")
+    for link in links:
+        if operator.contains(str(link), "canonical"):
+            channelId = str(link['href']).split("/channel/")[1]
+        if operator.contains(str(link), "content="):
+            channelName = str(link['content'])
+    Logger.info("channelId:"+channelId)
+    Logger.info("channelName:"+channelName)
+    channel = Channel.get_or_none(Channel.channelId == channelId)
+    if channel != None:
+        Logger.info("频道已存在:" + channelId)
+        return
+    Channel.create(channelTitle=channelName,
+                   channelId=channelId, channelLanguage=language)
+
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description='')
+    parser.add_argument('--db', type=str, default='')
+    parser.add_argument('--logDir', type=str, default='')
+    args = parser.parse_args()
+    Contant.db = args.db
+    Contant.logDir = args.logDir
+    initLogger()
+    ormInit()
+    Logger.info("SqlLite存放地址："+Contant.db)
+    Logger.info("日志文件存放地址："+Contant.logDir)
+    Logger.info("开始初始化...")
+    # checkInit()
+    # 读取txt文件获取需要的频道地址
+    Logger.info("开始读取需要新增的频道地址...")
+    urlList = []
+    # 打开文件
+    for line in open("urlList.txt"):
+        line = line.strip('\n')
+        urlList.append(line)
+    language = urlList[0]
+    for url in urlList:
+        if len(url) > 10:
+            saveChannel(url, language)
--- a/init/urlList.txt
+++ b/init/urlList.txt
@ -0,0 +1,14 @@
+zh-TW
+https://www.youtube.com/@TheStormMedia
+https://www.youtube.com/@57ETFN
+https://www.youtube.com/@MoneyNewWorld
+https://www.youtube.com/@tvbsmoney
+https://www.youtube.com/@TheMasterhsiao
+https://www.youtube.com/@mvp5888
+https://www.youtube.com/@HUNG64
+https://www.youtube.com/@user-vc2vr6tw4h
+https://www.youtube.com/ustv
+https://www.youtube.com/@leon888
+https://www.youtube.com/@smartmonthly-BW
+https://www.youtube.com/@ustvstockonline
+https://www.youtube.com/@AASTOCKS_AATV
--- a/init/urlList_hi.txt
+++ b/init/urlList_hi.txt
@ -0,0 +1,90 @@
+hi
+https://www.youtube.com/@procapitalacademy
+https://www.youtube.com/@TEACHERANISH
+https://www.youtube.com/@MarketGurukul1
+
+
+
+en
+https://www.youtube.com/@VishalKhandelwalshow
+https://www.youtube.com/@Elearnmarkets
+https://www.youtube.com/@MarketsMojo
+https://www.youtube.com/@TradeWithTrend
+https://www.youtube.com/@SHAREKHAN
+https://www.youtube.com/@AvadhutSatheTradingAcademy
+
+
+
+ko
+https://www.youtube.com/@E_TREND
+https://www.youtube.com/@hkwownet
+https://www.youtube.com/@giant_tv
+https://www.youtube.com/@StrongStock
+https://www.youtube.com/@stockwar999
+https://www.youtube.com/@user-sp1du8pm6q
+https://www.youtube.com/@talentinvestment
+https://www.youtube.com/@future_economy
+https://www.youtube.com/@user-sf7hm6xj8d
+https://www.youtube.com/@user-xv9xi6pi9o
+https://www.youtube.com/@user-rd8fd1xj9b
+https://www.youtube.com/@lucky_tv
+https://www.youtube.com/@Min_woo
+https://www.youtube.com/@taver1123
+https://www.youtube.com/@Super0Min
+https://www.youtube.com/@ap5798
+https://www.youtube.com/@drematree100
+https://www.youtube.com/@MKeconomy_TV
+https://www.youtube.com/@grit
+https://www.youtube.com/@user-zn9js9fg5i
+https://www.youtube.com/@youngikkim
+https://www.youtube.com/@DonNawa
+https://www.youtube.com/@woong-dal
+https://www.youtube.com/@johnleeschool
+https://www.youtube.com/@syukaworld-comics
+https://www.youtube.com/@channelA-news
+https://www.youtube.com/@user-bh7lr7pe9g
+https://www.youtube.com/@singlefire
+https://www.youtube.com/@moneyhi
+https://www.youtube.com/@top.trader
+https://www.youtube.com/@jusikdante
+
+
+
+zh-TW
+https://www.youtube.com/@kukantieh
+
+ja
+https://www.youtube.com/@DanTakahashi1
+https://www.youtube.com/@tvtokyobiz
+https://www.youtube.com/@SHO1112
+https://www.youtube.com/@pivot8935
+https://www.youtube.com/@nikkei
+https://www.youtube.com/@toushikomon
+https://www.youtube.com/@pivot8935
+https://www.youtube.com/@NewsPicks/featured
+https://www.youtube.com/@higedura24
+https://www.youtube.com/@tvtokyobiz
+https://www.youtube.com/@omaegaowattendayo
+https://www.youtube.com/@info_ask1
+https://www.youtube.com/@takaisanno/videos
+https://www.youtube.com/@takaponjp
+https://www.youtube.com/@tbsnewsdig
+https://www.youtube.com/@rehacq
+https://www.youtube.com/@mabuchi-mariko
+https://www.youtube.com/@fp_nigu
+https://www.youtube.com/@yukkuri-money
+https://www.youtube.com/@SHO1112
+https://www.youtube.com/@yohei-chokin
+https://www.youtube.com/@user-yu9sj9gq7z/videos
+https://www.youtube.com/@tesuta-clipping
+https://www.youtube.com/@tradelabo2222
+https://www.youtube.com/@jin115xx
+https://www.youtube.com/@higedura24
+https://www.youtube.com/@nobujuku
+https://www.youtube.com/@tokyosoken
+https://www.youtube.com/@user-hx7bn7hp9v
+https://www.youtube.com/@SLokRE
+https://www.youtube.com/@rehacq
+https://www.youtube.com/@moha-p
+https://www.youtube.com/results?search_query=Buffett+Taro%27s
+https://www.youtube.com/@Gorikoro
--- a/init/urlList_ja.txt
+++ b/init/urlList_ja.txt
@ -0,0 +1,7 @@
+ja
+https://www.youtube.com/@ryogakucho
+https://www.youtube.com/@DanTakahashi1
+https://www.youtube.com/@buffett_taro
+https://www.youtube.com/@Tsubame104
+https://www.youtube.com/@inc_academy
+https://www.youtube.com/@kamioka01
--- a/sftp/Contant.py
+++ b/sftp/Contant.py
@ -0,0 +1 @@
+logDir=""
--- a/sftp/LoggerUtils.py
+++ b/sftp/LoggerUtils.py
@ -0,0 +1,6 @@
+from loguru import logger
+import Contant
+Logger = logger
+def initLogger():
+    logger.add(Contant.logDir+"/sftp_{time}.log", rotation="500MB", encoding="utf-8",
+           enqueue=True, compression="zip", retention="10 days")
--- a/sftp/sftp.py
+++ b/sftp/sftp.py
@ -0,0 +1,97 @@
+import os
+import shutil
+import paramiko
+import argparse
+import Contant
+from LoggerUtils import Logger, initLogger
+import configparser
+import requests
+import time
+
+# python3 sftp.py --local="/mnt/tmp_srt_file" --logDir="./logs"
+# python3 sftp.py --local="/mnt/test_file" --logDir="./logs"
+if __name__ == "__main__":
+    # 读取参数
+    parser = argparse.ArgumentParser(description="")
+    parser.add_argument("--local", type=str, default="")
+    parser.add_argument('--logDir', type=str, default='')
+    args = parser.parse_args()
+    Contant.logDir = args.logDir
+    initLogger()
+
+    # 读取配置文件
+    config = configparser.ConfigParser()
+    config.read('sftp_config.ini')
+
+    # 获取SFTP配置信息
+    hostname = config.get('sftp_config', 'hostname')
+    port = config.getint('sftp_config', 'port')
+    username = config.get('sftp_config', 'username')
+    password = config.get('sftp_config', 'password')
+
+    Logger.info("host:{},port:{},username:{},password:{}".format(
+        hostname, port, username, password))
+
+    ssh_client = paramiko.SSHClient()
+    ssh_client.set_missing_host_key_policy(paramiko.AutoAddPolicy())
+    sftp_client = None  # 设置默认值
+    ssh_client.connect(hostname, port, username, password)
+    # 创建SFTP客户端
+    sftp_client = ssh_client.open_sftp()
+    Logger.info("SFTP客户端已经建立:{}".format(sftp_client))
+
+    remote_root = "/Inbound/YouTube Captions"
+    local_root = args.local
+    Logger.info("remote_root:{},local_root:{}".format(remote_root, local_root))
+
+    names = os.listdir(local_root)
+    for name in names:
+        # sftp创建文件夹
+        try:
+            sftp_client.chdir(remote_root + "/" + name)
+        except BaseException:
+            sftp_client.mkdir(remote_root + "/" + name)
+            sftp_client.chdir(remote_root + "/" + name)
+
+        # 遍历本地临时文件夹
+        srtList = os.listdir(local_root + "/" + name)
+        for srt in srtList:
+            # 获取远程文件路径以及本地文件路径
+            remotePath = remote_root + "/" + name + "/" + srt
+            localPath = local_root + "/" + name + "/" + srt
+            # 如果远程文件存在，则进行删除
+            try:
+                sftp_client.stat(remotePath)
+                # 如果文件存在，删除它
+                sftp_client.remove(remotePath)
+                Logger.info("Remote file '{}' deleted.".format(remotePath))
+            except FileNotFoundError:
+                Logger.info("Remote file '{}' not found.".format(remotePath))
+            # 上传本地文件
+            try:
+                # 判断远程地址长度，过长需要截取一部分
+                if len(remotePath) > 120:
+                    remotePath = remotePath[:-20] + ".srt"
+                # 判断本地文件是否存在，存在则上传
+                if os.path.exists(localPath):
+                    Logger.info("本地文件 '{}' 存在，开始上传.".format(localPath))
+                    sftp_client.put(localPath, remotePath, confirm=False)
+                    os.remove(localPath)
+                else:
+                    Logger.info("本地文件 '{}' 不存在，无法上传.".format(localPath))
+            except Exception as e:
+                Logger.info("上传失败 '{}' 文件名长度{}".format(
+                    remotePath, len(remotePath)))
+                Logger.error(e)
+                sftp_client.close()
+                sftp_client = ssh_client.open_sftp()
+    # 发送钉钉消息
+    webhook = "https://oapi.dingtalk.com/robot/send?access_token=c8c8d7d42c4eecd449dd303025ef968f647d1d8e8694e3fabc0ab5770d646dcb"
+    jsonData = {
+        "msgtype": "text",
+        "text": {
+            "content": "[Youtube]sftp finished"
+        }
+    }
+    requests.post(webhook, json=jsonData)
+    Logger.info("sftp发送钉钉消息成功...")
--- a/sftp/sftp_config.ini
+++ b/sftp/sftp_config.ini
@ -0,0 +1,5 @@
+[sftp_config]
+hostname = filetransfer.blackrock.com
+port = 22
+username = ftp_yunbo
+password = s8v{8SJr
--- a/src/ChannelService.py
+++ b/src/ChannelService.py
@ -0,0 +1,15 @@
+import json
+from Orm import Channel
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+
+class ChannelService:
+    def getOneByChannelId(channelId):
+        return Channel.get_or_none(Channel.channelId == channelId)
+
+    def updateTimeByChannelId(channelId, chageTime):
+        Channel.update(channelReptileTime=chageTime).where(
+            Channel.channelId == channelId).execute()
+
+    def getChannelList():
+        return Channel.select().execute()
--- a/src/Contant.py
+++ b/src/Contant.py
@ -0,0 +1,4 @@
+db=""
+logDir=""
+startTime=""
+endTime=""
--- a/src/DownloadInfoService.py
+++ b/src/DownloadInfoService.py
@ -0,0 +1,16 @@
+from Orm import DownloadInfo
+
+
+class DownloadService:
+
+    def createOne(videoId, downloadType, tryTime, isFinished):
+        DownloadInfo.create(
+            videoId=videoId,
+            downloadType=downloadType,
+            tryTime=tryTime,
+            isFinished=isFinished
+        )
+
+    def updateInfoByVideoId(videoId, tryTime, isFinished):
+        DownloadInfo.update(tryTime=tryTime, isFinished=isFinished).where(
+            DownloadInfo.videoId == videoId).execute()
--- a/src/LoggerUtils.py
+++ b/src/LoggerUtils.py
@ -0,0 +1,6 @@
+from loguru import logger
+import Contant
+Logger = logger
+def initLogger():
+    logger.add(Contant.logDir+"/main_{time}.log", rotation="500MB", encoding="utf-8",
+           enqueue=True, compression="zip", retention="10 days")
--- a/src/Orm.py
+++ b/src/Orm.py
@ -0,0 +1,68 @@
+from peewee import *
+import Contant
+import argparse
+from LoggerUtils import Logger
+
+parser = argparse.ArgumentParser(description='')
+parser.add_argument('--db', type=str, default='')
+parser.add_argument('--logDir', type=str, default='')
+parser.add_argument("--start", type=str, default="")
+parser.add_argument("--end", type=str, default="")
+parser.add_argument("--channelId", type=str, default="")
+args = parser.parse_args()
+Contant.db = args.db
+db = SqliteDatabase(Contant.db)
+
+
+def ormInit():
+    Channel.create_table()
+    Video.create_table()
+    DownloadInfo.create_table()
+
+
+class BaseModel(Model):
+    class Meta:
+        database = db
+
+# 频道信息
+
+
+class Channel(BaseModel):
+    id = PrimaryKeyField()
+    channelId = CharField(null=False)
+    channelTitle = CharField(null=False)
+    channelLanguage = CharField()
+    channelReptileTime = CharField(null=True)
+
+    class Meta:
+        db_table = 'Channel'
+
+# 视频信息
+
+
+class Video(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField(null=False)
+    channelId = CharField(null=False)
+    videoTitle = CharField()
+    videoLen = IntegerField()
+    videoType = CharField()
+    videoPublishTime = CharField()
+    videoLanguage = CharField()
+    isDownload = IntegerField()
+
+    class Meta:
+        db_table = 'Vidoes'
+
+# 下载信息
+
+
+class DownloadInfo(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField()
+    downloadType = IntegerField()
+    tryTime = IntegerField()
+    isFinished = IntegerField()
+
+    class Meta:
+        db_table = 'Download_info'
--- a/src/SrcTest.py
+++ b/src/SrcTest.py
--- a/src/VideoService.py
+++ b/src/VideoService.py
@ -0,0 +1,31 @@
+import json
+from Orm import Video
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+
+class VideoService:
+    def getOneByVideoId(videoId):
+        return Video.get_or_none(Video.videoId == videoId)
+
+    def createOne(videoId, channelId, videoTitle, videoLen, videoType, videoPublishTime, videoLanguage, isDownload):
+        Video.create(videoId=videoId,
+                     channelId=channelId,
+                     videoTitle=videoTitle,
+                     videoLen=videoLen,
+                     videoType=videoType,
+                     videoPublishTime=videoPublishTime,
+                     videoLanguage=videoLanguage,
+                     isDownload=isDownload)
+
+    def updateLenByVideoId(videoId, len):
+        Video.update(videoLen=len).where(Video.videoId == videoId).execute()
+
+    def getLastVideoByChannelId(channelId):
+        return Video.select().where(Video.channelId == channelId).order_by(Video.videoPublishTime.desc()).get()
+
+    def getFirstVideoByChannelId(channelId):
+        return Video.select().where(Video.channelId == channelId).order_by(Video.videoPublishTime).get()
+
+    def checkExist(channelId):
+        query = Video.select().where(Video.channelId == channelId)
+        return query.exists()
--- a/src/YouTubeUtils.py
+++ b/src/YouTubeUtils.py
@ -0,0 +1,169 @@
+import httplib2
+import googleapiclient.discovery
+import googleapiclient.errors
+from VideoService import VideoService
+from ChannelService import ChannelService
+from DownloadInfoService import DownloadService
+from LoggerUtils import Logger
+import operator
+import time
+
+
+class YouTubeUtil:
+    # apiKeys = ["AIzaSyDlRgmPXVQEjF2gbmomI5FUZX_uAOBmEGI", "AIzaSyBI5i5vFZpQErMnEXKMf0VUS2Bel8jGrTk",
+    #            "AIzaSyAnmA0Ggy1yXsZZACfItmeZAa7wcmh6SbM", "AIzaSyC4O8tBoAfkupmBybxDah2JUxgj4ct5uk0",
+    #            "AIzaSyDJ2S9Ijhw_hULx3nHvPUoGUpMENbZOIl8", "AIzaSyA87Ckpna3hOQ31nISs8V8rp--OLw0m6Aw",
+    #            "AIzaSyDIWbV0EOLHkOr9tWpANose6ggd2r9vcLg", "AIzaSyBKE3lYwWFIYc9Vx4YKMbRpkOXigZlY52U"]
+
+    # AIzaSyCTBSbq0YjyxTtjmNsnDyKAwHamlv_ST-s
+    # AIzaSyAESnwtbTIBtU707iZowtQkmAo-qKuEOcY
+    # AIzaSyCsYUC5vN0pB6y9xsCj0B1ehAoqOJ3WMf0
+    # AIzaSyDjPkCgDQ9Tv_xcChjY2E6GpJ6IzngnD5I
+    # AIzaSyAxIycOdQYGB5kWhwe3B-kJAYRo7wOnp8o
+    apiKeys = [
+        "AIzaSyARaW3mqO9szQiHgWZR4el0HWvdyheSHBc",
+        "AIzaSyChPXesnVx6fweon_BckhR6UiJWvi5Ma4s"
+
+        # "AIzaSyCTBSbq0YjyxTtjmNsnDyKAwHamlv_ST-s",
+        # "AIzaSyAESnwtbTIBtU707iZowtQkmAo-qKuEOcY"
+
+        
+        # "AIzaSyDjPkCgDQ9Tv_xcChjY2E6GpJ6IzngnD5I",
+        # "AIzaSyAxIycOdQYGB5kWhwe3B-kJAYRo7wOnp8o",
+        # "AIzaSyCsYUC5vN0pB6y9xsCj0B1ehAoqOJ3WMf0"
+    ]
+
+    apiIndex = 0
+
+    def getYoutube():
+        # proxy_info = httplib2.ProxyInfo(
+        #     proxy_type=httplib2.socks.PROXY_TYPE_HTTP, proxy_host="127.0.0.1", proxy_port=7890)
+        # http = httplib2.Http(timeout=10, proxy_info=proxy_info,
+        #                      disable_ssl_certificate_validation=False)
+        http = httplib2.Http(timeout=10, disable_ssl_certificate_validation=False)
+        api_service_name = "youtube"
+        api_version = "v3"
+        # 获取apiKey
+        apiKey = YouTubeUtil.apiKeys[YouTubeUtil.apiIndex]
+        Logger.info(
+            "当前APIKey:{},当前apiIndex:{},totalIndex:{}".format(
+                apiKey, YouTubeUtil.apiIndex, len(YouTubeUtil.apiKeys) - 1
+            )
+        )
+        # 等于7，还原成0
+        if YouTubeUtil.apiIndex == (len(YouTubeUtil.apiKeys) - 1):
+            YouTubeUtil.apiIndex = 0
+        else:
+            YouTubeUtil.apiIndex = YouTubeUtil.apiIndex + 1
+
+        # 获取对象
+        youtube = googleapiclient.discovery.build(
+            api_service_name, api_version, developerKey=apiKey, http=http
+        )
+        return youtube
+
+    def getVidoeLen(videoIds):
+        youtube = YouTubeUtil.getYoutube()
+        request = youtube.videos().list(part="contentDetails", id=videoIds)
+        response = request.execute()
+        response["items"][0]["contentDetails"]
+        return response
+
+    def getVideoLenByStr(str):
+        len = 0
+        str = str.split("PT")[1]
+        if operator.contains(str, "H"):
+            H = str.split("H")[0]
+            len = len + int(H) * 3600
+            str = str.split("H")[1]
+        if operator.contains(str, "M"):
+            M = str.split("M")[0]
+            len = len + int(M) * 60
+            str = str.split("M")[1]
+        if operator.contains(str, "S"):
+            S = str.split("S")[0]
+            len = len + int(S)
+        return len
+
+    def getByChannelId(channelId, startTime, endTime):
+        channel = ChannelService.getOneByChannelId(channelId)
+        if channel == None:
+            return
+        videoLanguage = str(channel.channelLanguage)
+        youtube = YouTubeUtil.getYoutube()
+        request = youtube.search().list(
+            part="snippet",
+            channelId=channelId,
+            maxResults=50,
+            order="date",
+            publishedAfter=startTime,
+            publishedBefore=endTime,
+            type="video",
+        )
+        response = request.execute()
+        while True:
+            videosRequest = ""
+            videosRequestCount = 0
+            idList = []
+            for i in response["items"]:
+                try:
+                    videoId = i["id"]["videoId"]
+                    publisTime = i["snippet"]["publishedAt"]
+                    videoTitle = i["snippet"]["title"]
+                    videoType = "video"
+                    videoEntity = VideoService.getOneByVideoId(str(videoId))
+                    if videoEntity == None:
+                        VideoService.createOne(
+                            videoId,
+                            channelId,
+                            videoTitle,
+                            0,
+                            videoType,
+                            publisTime,
+                            videoLanguage,
+                            0,
+                        )
+                        DownloadService.createOne(videoId, 1, 0, 0)
+                        videosRequest = videosRequest + "," + str(videoId)
+                        videosRequestCount = videosRequestCount + 1
+                        Logger.info(
+                            "存储VideoUrl:https://www.youtube.com/watch?v=" + videoId
+                        )
+                    else:
+                        Logger.info("已存在VideoId:{}".format(videoId))
+                    idList.append(str(videoId))
+                    if videosRequest != "" and videosRequestCount >= 10:
+                        lenRes = YouTubeUtil.getVidoeLen(videosRequest)
+                        for i in lenRes["items"]:
+                            tmpId = i["id"]
+                            videoLenStr = i["contentDetails"]["duration"]
+                            videoLen = YouTubeUtil.getVideoLenByStr(videoLenStr)
+                            VideoService.updateLenByVideoId(tmpId, videoLen)
+                            Logger.info(
+                                "更新时长,videoId:{},len:{}".format(tmpId, videoLen)
+                            )
+                        videosRequestCount = 0
+                        videosRequest = ""
+                except:
+                    pass
+            # 获取最后一个视频
+            vidoeo = VideoService.getLastVideoByChannelId(channelId)
+            ChannelService.updateTimeByChannelId(channelId, vidoeo.videoPublishTime)
+            time.sleep(5)
+            try:
+                # youtube = YouTubeUtil.getYoutube
+                request = youtube.search().list(
+                    part="snippet",
+                    channelId=channelId,
+                    maxResults=50,
+                    order="date",
+                    publishedAfter=startTime,
+                    publishedBefore=endTime,
+                    type="video",
+                    pageToken=response["nextPageToken"],
+                )
+                response = request.execute()
+            except Exception as e:
+                Logger.error(e)
+                print("no nextPageToken")
+                break
--- a/src/main.py
+++ b/src/main.py
@ -0,0 +1,49 @@
+import argparse
+import Contant
+import LoggerUtils
+import Orm
+from VideoService import VideoService
+from YouTubeUtils import YouTubeUtil
+from ChannelService import ChannelService
+import requests
+
+# py .\main.py --db=../db/youtube_prod.db --logDir=./logs --start="2023-09-10T00:00:01Z" --end="2023-09-11T00:00:01Z"
+# python3 ./main.py --db="../db/youtube_prod.db" --logDir="./logs" --start="2024-03-25T00:10:01Z" --end="2024-03-26T00:10:01Z"
+# python3 ./main.py --db="../db/youtube_prod.db" --logDir="./logs" --start="111" --end="222"
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description="")
+    parser.add_argument("--db", type=str, default="")
+    parser.add_argument("--logDir", type=str, default="")
+    parser.add_argument("--start", type=str, default="")
+    parser.add_argument("--end", type=str, default="")
+    args = parser.parse_args()
+    Contant.db = args.db
+    Contant.logDir = args.logDir
+    Contant.startTime = args.start
+    Contant.endTime = args.end
+    LoggerUtils.initLogger()
+    Orm.ormInit()
+    LoggerUtils.Logger.info("db:{},logDir:{}".format(Contant.db, Contant.logDir))
+    LoggerUtils.Logger.info("starTime:{},endTime:{}".format(Contant.startTime, Contant.endTime))
+
+    # 执行查询
+    channelList = ChannelService.getChannelList()
+    LoggerUtils.Logger.info("list size:{}".format(len(channelList)))
+    for channel in channelList:
+        channelId = channel.channelId
+        LoggerUtils.Logger.info(
+            "channelId:{},startTime:{},endTime:{}".format(
+                channelId, Contant.startTime, Contant.endTime
+            )
+        )
+        YouTubeUtil.getByChannelId(channelId, Contant.startTime, Contant.endTime)
+    # 发送钉钉消息
+    webhook = "https://oapi.dingtalk.com/robot/send?access_token=c8c8d7d42c4eecd449dd303025ef968f647d1d8e8694e3fabc0ab5770d646dcb"
+    jsonData = {
+        "msgtype": "text",
+        "text": {
+            "content": "[Youtube]src finished"
+        }
+    }
+    requests.post(webhook, json=jsonData)
+    LoggerUtils.Logger.info("src发送钉钉消息成功...")
--- a/src/one_channel.py
+++ b/src/one_channel.py
@ -0,0 +1,32 @@
+import argparse
+import Contant
+import LoggerUtils
+import Orm
+from VideoService import VideoService
+from YouTubeUtils import YouTubeUtil
+from ChannelService import ChannelService
+import requests
+
+# py .\main.py --db=../db/youtube_prod.db --logDir=./logs --start="2023-09-10T00:00:01Z" --end="2023-09-11T00:00:01Z"
+# python3 ./main.py --db="../db/youtube_prod.db" --logDir="./logs" --start="2023-08-10T00:00:01Z" --end="2023-09-12T00:00:01Z"
+# python3 ./main.py --db="../db/youtube_prod.db" --logDir="./logs" --start="111" --end="222"
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCzoF2M_RG3Qz10hP16vQOng"
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description="")
+    parser.add_argument("--db", type=str, default="")
+    parser.add_argument("--logDir", type=str, default="")
+    parser.add_argument("--start", type=str, default="")
+    parser.add_argument("--end", type=str, default="")
+    parser.add_argument("--channelId", type=str, default="")
+    args = parser.parse_args()
+    Contant.db = args.db
+    Contant.logDir = args.logDir
+    Contant.startTime = args.start
+    Contant.endTime = args.end
+    channelId = args.channelId
+    LoggerUtils.initLogger()
+    Orm.ormInit()
+    LoggerUtils.Logger.info("db:{},logDir:{}".format(Contant.db, Contant.logDir))
+    LoggerUtils.Logger.info("channleId:{},starTime:{},endTime:{}".format(channelId, Contant.startTime, Contant.endTime))
+
+    YouTubeUtil.getByChannelId(channelId, Contant.startTime, Contant.endTime)
--- a/src_tmp.sh
+++ b/src_tmp.sh
@ -0,0 +1,87 @@
+#!/bin/bash
+cd /mnt/youtube_prod/src
+
+
+
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCpsfkRRT7L2nBnizBn_u9YA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCRbT3P-2tmr-9l8D7jNoZMQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCPTy0BNqiv-0SdAvFgrXvXg"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCMlDu8Vuowmqz03kByFcUhw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC5mn3VEg_9GY52G6eumKJRg"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UClhhyZ0xyeOAEVdcr0N9KDA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCBM86JVoHLqg9irpR2XKvGw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCzp9CmDIFVNtzhyOjptIi4g"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCv-spDeZBGYVUI9eGXGaLSg"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCF08I8KEKTsBo22RIXFwTAA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC5Mjj4LKlMtP_PXlIVYGxIQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCvil4OAt-zShzkKHsg9EQAw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCI6C5V4J8FWRcLcOdh1yElw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCOio3vyYLWiKlHSYRKW-9UA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCaWi2foADm_lKAKnmeQwLSA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCUFUOdQwKTWda7kKqxQwMxw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCoZdXdFowKP0heWRkQ9RABQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCnfwIKyFYRuqZzzKBDt6JOA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCnZJqzwt6LuRymM0jbqiD9A"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCHpGooMnVgnILywqrpqvZcQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCQIyAcoLsO3L0RMFQk7YMYA"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCYdHxiRAUUJhuE1DZsnWqXg"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCbOIEn95Rvnk97KRtSFqvbQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCXWOlSe2GHTev8QZhY_gMPg"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCJo6G1u0e_-wS-JQn3T-zEw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCfq4V1DAuaojnr2ryvWNysw"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCFznPlqnBtRKQhtkm6GGoRQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC5CyCSvCdoEP-VgQmFq3iww"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC6mp159KMtzjhP65DmldR0A"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC7YLvjJf3lDJUQ-TsbWyBjg"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC6ij59Gy_HnqO4pFu9A_zgQ"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCpyjRAERLqcD_wI3qQnIY3A"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCSU_iBWoCnXe1VnAbQhO3Ug"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC6ZkHcW5QQubZ-Q6XYINE3Q"
+# sleep 600
+# python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCDpRrAXMYlxFz3a5-z8pE7w"
+# sleep 600
+python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCMec1m9iUC3agiEK-nsndSg"
+sleep 600
+python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCOmXyHRWpDFPYgs2VpoQEIw"
+sleep 600
+python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCPgT-N-DQ0K0H88skjaDgkA"
+sleep 600
+python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UC40nk9kM2Ue8XQ9LsHQlKPA"
+sleep 600
+python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCaiV1-PUXDu2Nmx8iOZkofQ"
+sleep 600
+python3 ./one_channel.py --db="../db/youtube_prod.db" --logDir="./logs/one_channel" --start="2021-03-06T00:00:01Z" --end="2024-03-06T00:00:01Z" --channelId="UCDDneQi63kJAdr3i5VCPzHg"
+sleep 600
--- a/start_download.sh
+++ b/start_download.sh
@ -0,0 +1,10 @@
+#!/bin/bash
+function log() {
+    local time_now=`date '+%Y-%m-%d %H:%M:%S'`
+    echo "$time_now  [download] [info] $1" >> /mnt/youtube_prod/running.log
+}
+
+cd /mnt/youtube_prod/download
+# /mnt/youtube_prod/start_download.sh
+log "开始执行download..."
+nohup python3 ./main_download.py --db="../db/youtube_prod.db" --logDir="./logs" >/dev/null 2>/mnt/youtube_prod/err.log &
--- a/start_sftp.sh
+++ b/start_sftp.sh
@ -0,0 +1,11 @@
+#!/bin/bash
+function log() {
+    local time_now=`date '+%Y-%m-%d %H:%M:%S'`
+    echo "$time_now  [download] [info] $1" >> /mnt/youtube_prod/running.log
+}
+
+cd /mnt/youtube_prod/sftp
+# /mnt/youtube_prod/start_download.sh
+log "开始执行sftp..."
+python3 ./sftp.py --local="/mnt/tmp_srt_file" --logDir="./logs"
+rm -rf /mnt/tmp_srt_file
--- a/start_src.sh
+++ b/start_src.sh
@ -0,0 +1,12 @@
+#!/bin/bash
+function log() {
+    local time_now=`date '+%Y-%m-%d %H:%M:%S'`
+    echo "$time_now  [src] [info] $1" >> /mnt/youtube_prod/running.log
+}
+
+cd /mnt/youtube_prod/src
+start=`date '+%Y-%m-%dT%H:%M:%SZ' -d'-1 day'`
+end=`date '+%Y-%m-%dT%H:%M:%SZ'`
+log "开始执行src...startTime:"$start",endTime:"$end
+# /mnt/youtube_prod/start_src.sh
+nohup python3 ./main.py --db="../db/youtube_prod.db" --logDir="./logs" --start=$start --end=$end >/dev/null 2>/mnt/youtube_prod/err.log &
--- a/stop_download.sh
+++ b/stop_download.sh
@ -0,0 +1,4 @@
+#!/bin/bash
+pid=`ps -ef | grep main_download | awk NR==1'{print $2}'`
+echo $pid
+kill -9 $pid
--- a/test.sh
+++ b/test.sh
@ -0,0 +1,2 @@
+#!/bin/bash
+echo "test"
--- a/test/test.py
+++ b/test/test.py
@ -0,0 +1,9 @@
+import requests
+webhook = "https://oapi.dingtalk.com/robot/send?access_token=c8c8d7d42c4eecd449dd303025ef968f647d1d8e8694e3fabc0ab5770d646dcb"
+jsonData = {
+    "msgtype": "text",
+    "text": {
+        "content": "[Youtube]aaaa"
+    }
+}
+requests.post(webhook, json=jsonData)
--- a/test/test2.py
+++ b/test/test2.py
@ -0,0 +1,8 @@
+from youtube_transcript_api import YouTubeTranscriptApi
+#zh-Hant
+url = "https://www.youtube.com/watch?v=YbVger_nh-s"
+list = YouTubeTranscriptApi.list_transcripts("_i5CoY_LMYs")
+# videoSrt = YouTubeTranscriptApi.get_transcript(
+#                 "gXeNXJrD-gw", languages=['zh-TW'])
+print(list)
+# print(videoSrt)
--- a/view_count/ChannelService.py
+++ b/view_count/ChannelService.py
@ -0,0 +1,15 @@
+import json
+from Orm import Channel
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+
+class ChannelService:
+    def getOneByChannelId(channelId):
+        return Channel.get_or_none(Channel.channelId == channelId)
+
+    def updateTimeByChannelId(channelId, chageTime):
+        Channel.update(channelReptileTime=chageTime).where(
+            Channel.channelId == channelId).execute()
+
+    def getChannelList():
+        return Channel.select().execute()
--- a/view_count/Contant.py
+++ b/view_count/Contant.py
@ -0,0 +1,10 @@
+db=""
+logDir=""
+startTime=""
+endTime=""
+apiIndex = 0
+apiKeys = [
+    "AIzaSyDjPkCgDQ9Tv_xcChjY2E6GpJ6IzngnD5I",
+    "AIzaSyAxIycOdQYGB5kWhwe3B-kJAYRo7wOnp8o",
+    "AIzaSyCsYUC5vN0pB6y9xsCj0B1ehAoqOJ3WMf0"
+]
--- a/view_count/LoggerUtils.py
+++ b/view_count/LoggerUtils.py
@ -0,0 +1,6 @@
+from loguru import logger
+import Contant
+Logger = logger
+def initLogger():
+    logger.add(Contant.logDir+"/main_{time}.log", rotation="500MB", encoding="utf-8",
+           enqueue=True, compression="zip", retention="10 days")
--- a/view_count/Orm.py
+++ b/view_count/Orm.py
@ -0,0 +1,75 @@
+from peewee import *
+import Contant
+import argparse
+from LoggerUtils import Logger
+
+parser = argparse.ArgumentParser(description='')
+parser.add_argument('--db', type=str, default='')
+parser.add_argument('--logDir', type=str, default='')
+args = parser.parse_args()
+Contant.db = args.db
+db = SqliteDatabase(Contant.db)
+
+
+def ormInit():
+    Channel.create_table()
+    Video.create_table()
+    DownloadInfo.create_table()
+    ViewCountInfo.create_table()
+
+
+class BaseModel(Model):
+    class Meta:
+        database = db
+
+# 频道信息
+
+
+class Channel(BaseModel):
+    id = PrimaryKeyField()
+    channelId = CharField(null=False)
+    channelTitle = CharField(null=False)
+    channelLanguage = CharField()
+    channelReptileTime = CharField(null=True)
+
+    class Meta:
+        db_table = 'Channel'
+
+# 视频信息
+
+
+class Video(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField(null=False)
+    channelId = CharField(null=False)
+    videoTitle = CharField()
+    videoLen = IntegerField()
+    videoType = CharField()
+    videoPublishTime = CharField()
+    videoLanguage = CharField()
+    isDownload = IntegerField()
+
+    class Meta:
+        db_table = 'Vidoes'
+
+# 下载信息
+
+
+class DownloadInfo(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField()
+    downloadType = IntegerField()
+    tryTime = IntegerField()
+    isFinished = IntegerField()
+
+    class Meta:
+        db_table = 'Download_info'
+
+# 播放量信息
+class ViewCountInfo(BaseModel):
+    id = PrimaryKeyField()
+    videoId = CharField()
+    viewCount = CharField()
+
+    class Meta:
+        db_table = 'ViewCount_info'
--- a/view_count/VideoCountService.py
+++ b/view_count/VideoCountService.py
@ -0,0 +1,33 @@
+import json
+from Orm import ViewCountInfo
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+
+class ViewCountService:
+    def createOrUpdateOne(videoId, day,count):
+        query = ViewCountInfo.select().where(ViewCountInfo.videoId == videoId)
+        if not query:
+            countStr = "0"
+            for i in range(0,30):
+                if i != 29:
+                    countStr = countStr + "," + "0"
+            list = countStr.split(",")
+            list[day-1] = count
+            countStr = ""
+            for i in range(0,30):
+                if i != 29:
+                    countStr = countStr + str(list[i]) + ","
+                else:
+                    countStr = countStr + str(list[i])
+            ViewCountInfo.create(videoId=videoId, viewCount=countStr)
+        else:
+            viewCountInfo = ViewCountInfo.select().where(ViewCountInfo.videoId == videoId).get()
+            list = viewCountInfo.viewCount.split(",")
+            list[day-1] = count
+            countStr = ""
+            for i in range(0,30):
+                if i != 29:
+                    countStr = countStr + str(list[i]) + ","
+                else:
+                    countStr = countStr + str(list[i])
+            ViewCountInfo.update(viewCount=countStr).where(ViewCountInfo.videoId == videoId).execute()
--- a/view_count/VideoService.py
+++ b/view_count/VideoService.py
@ -0,0 +1,34 @@
+import json
+from Orm import Video
+from playhouse.shortcuts import model_to_dict, dict_to_model
+
+
+class VideoService:
+    def getOneByVideoId(videoId):
+        return Video.get_or_none(Video.videoId == videoId)
+
+    def createOne(videoId, channelId, videoTitle, videoLen, videoType, videoPublishTime, videoLanguage, isDownload):
+        Video.create(videoId=videoId,
+                     channelId=channelId,
+                     videoTitle=videoTitle,
+                     videoLen=videoLen,
+                     videoType=videoType,
+                     videoPublishTime=videoPublishTime,
+                     videoLanguage=videoLanguage,
+                     isDownload=isDownload)
+
+    def updateLenByVideoId(videoId, len):
+        Video.update(videoLen=len).where(Video.videoId == videoId).execute()
+
+    def getLastVideoByChannelId(channelId):
+        return Video.select().where(Video.channelId == channelId).order_by(Video.videoPublishTime.desc()).get()
+
+    def getFirstVideoByChannelId(channelId):
+        return Video.select().where(Video.channelId == channelId).order_by(Video.videoPublishTime).get()
+
+    def checkExist(channelId):
+        query = Video.select().where(Video.channelId == channelId)
+        return query.exists()
+    
+    def getVideosByTime(startTime,endTime):
+        return Video.select().where(Video.videoPublishTime >= startTime,Video.videoPublishTime <= endTime).execute()
--- a/view_count/view_count_main.py
+++ b/view_count/view_count_main.py
@ -0,0 +1,99 @@
+import argparse
+import random
+import time
+import Contant
+from LoggerUtils import Logger, initLogger
+import Orm
+from VideoService import VideoService
+from ChannelService import ChannelService
+from VideoCountService import ViewCountService
+from func_timeout import func_set_timeout
+import func_timeout
+import requests
+import httplib2
+import googleapiclient.discovery
+import googleapiclient.errors
+import datetime
+
+apiIndex = 0
+apiKeys = [
+    "AIzaSyDjPkCgDQ9Tv_xcChjY2E6GpJ6IzngnD5I",
+    "AIzaSyAxIycOdQYGB5kWhwe3B-kJAYRo7wOnp8o",
+    "AIzaSyCsYUC5vN0pB6y9xsCj0B1ehAoqOJ3WMf0"
+]
+
+
+def getYoutube():
+    proxy_info = httplib2.ProxyInfo(
+        proxy_type=httplib2.socks.PROXY_TYPE_HTTP, proxy_host="127.0.0.1", proxy_port=7890)
+    # http = httplib2.Http(timeout=10, proxy_info=proxy_info,
+    #  disable_ssl_certificate_validation=False)
+    http = httplib2.Http(timeout=10, disable_ssl_certificate_validation=False)
+    # http = httplib2.Http(timeout=10, disable_ssl_certificate_validation=False)
+    api_service_name = "youtube"
+    api_version = "v3"
+    # 获取apiKey
+    apiKey = "AIzaSyARaW3mqO9szQiHgWZR4el0HWvdyheSHBc"
+
+    # 获取对象
+    youtube = googleapiclient.discovery.build(
+        api_service_name, api_version, developerKey=Contant.apiKeys[Contant.apiIndex], http=http
+    )
+    return youtube
+
+
+def updateVideoViewCount(day, startTime, endTime):
+    list = VideoService.getVideosByTime(startTime, endTime)
+    Logger.info(len(list))
+    videoCount = 0
+    totalCount = 0
+    videosRequest = ""
+    youtube = getYoutube()
+    for video in list:
+        videoCount = videoCount + 1
+        totalCount = totalCount + 1
+        Logger.info(video.videoId)
+        videosRequest = videosRequest + "," + video.videoId
+        if videoCount == 50 or videoCount == len(list) or totalCount == len(list):
+            request = youtube.videos().list(part="statistics", id=videosRequest)
+            if Contant.apiIndex < (len(Contant.apiKeys) - 1):
+                Contant.apiIndex = Contant.apiIndex + 1
+            else:
+                Contant.apiIndex = 0
+            response = request.execute()
+            for item in response['items']:
+                try:
+                    Logger.info(item)
+                    ViewCountService.createOrUpdateOne(
+                        item['id'], day, item['statistics']['viewCount'])
+                except Exception as e:
+                    Logger.error("存储失败{}".format(item))
+            videosRequest = ""
+            videoCount = 0
+
+# python ./view_count_main.py --db="../db/youtube_prod.db" --logDir="./logs" --start="2024-01-03T00:00:00Z" --end="2024-01-04T00:00:00Z"
+
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description='')
+    parser.add_argument('--db', type=str, default='')
+    parser.add_argument('--logDir', type=str, default='')
+    args = parser.parse_args()
+    Contant.db = args.db
+    Contant.logDir = args.logDir
+    initLogger()
+    Orm.ormInit()
+    # 查询30天内的所有视屏
+    now = datetime.datetime.now()
+    zero_today = now.replace(hour=0, minute=0, second=0, microsecond=0)
+    end_today = now.replace(hour=23, minute=59, second=59, microsecond=0)
+    for i in range(1, 31):
+        startTime = zero_today+datetime.timedelta(days=-i)
+        endTime = end_today+datetime.timedelta(days=-i)
+        startTime = startTime.strftime("%Y-%m-%dT%H:%S:%MZ")
+        endTime = endTime.strftime("%Y-%m-%dT%H:%S:%MZ")
+        Logger.info("day:%d, startTime:%s, endTime:%s" %
+                    (i, startTime, endTime))
+        updateVideoViewCount(i, startTime, endTime)
+    # zero_today = zero_today.strftime("%y-%m-%dT%H:%S:%MZ")
+    # print(zero_today)