Python 4

Whisper에 단어별 타임스탬프가 필요할 때 - whisperX or whisper-timestamped

지난번에 'Whisper API로 음성을 텍스트로 추출하기' 를 했었다. https://jellyfishdeveloper.tistory.com/entry/python%EC%9C%BC%EB%A1%9C-%EC%9C%A0%ED%8A%9C%EB%B8%8C-%EC%9E%90%EB%A7%89-%EB%8B%A4%EC%9A%B4%EB%A1%9C%EB%93%9C-%EB%B2%88%EC%97%AD%ED%95%B4%EB%B3%B4%EA%B8%B0-feat-ChatGPT-Whisper-api python으로 유튜브 자막 다운로드, 번역해보기 (feat. ChatGPT, Whisper api) 유튜브로 영어 자막 스크립트를 추출하고 해당 자막을 chatGPT를 이용해서 한국어로 번역해보려고 한다. 만약 자막이 없으면 Whisp..

Python 2023.06.18

python으로 유튜브 자막 다운로드, 번역해보기 (feat. ChatGPT, Whisper api)

유튜브로 영어 자막 스크립트를 추출하고 해당 자막을 chatGPT를 이용해서 한국어로 번역해보려고 한다. 만약 자막이 없으면 Whisper API를 통해 음성을 텍스트로 추출하고 해당 텍스트를 번역해볼 예정이다 1. 유튜브로 자막 스크립트 추출하기 youtube-transcript-api라는 라이브러리를 사용했다. 자막이 있는 영상에서 텍스트 및 타임스탬프 추출이 가능하다. 해당 라이브러리에서 번역 기능도 제공하기는 하지만 ChatGPT보다는 기능이 좋지 않아서 번역 기능은 사용하지 않았다. 테스트 영상으로는 BTS의 UN 연설 영상을 사용해보려고 한다 https://www.youtube.com/watch?v=XXCqBotaGRI 우선 YouTubeTransciptAPI를 설치한다 pip install ..

Python 2023.04.09

[Locust] 부하테스트 툴 사용 방법

INTRO 업무 중에 여러개의 request가 동시에 들어왔을 때 생기는 오류가 있었다. 코드를 수정하고 테스트를 충분히 해보고 싶었는데 스웨거나 포스트맨으로만 테스트하기에는 한계가 있어서 부하 테스트 도구인 LOCUST를 사용해보게 되었다. https://locust.io/ (google에 locust로 검색하면 온갖 메뚜기 이미지가 나와서 징그러울 수 있으니 주의!) Locust는 파이썬으로 작성된 오픈 소스 부하 테스트 도구이다. 웹 사이트 성능 테스트에 유용하고 사용자 동시 접속수를 증가시키는 시뮬레이션을 할 수 있어서 시스템이 얼마나 많은 부하를 견딜 수 있는지 체크할 수 있다. 설치 방법 파이썬 3.7 이상이 설치되어 있어야 한다 pip3 install locust 잘 설치되었는지 확인! lo..

Python 2023.03.26

[Python] 파이썬 classmethod와 staticmethod 차이

회사 코드를 보면 종종 @classmethod, @staticmethod 를 사용하는데 정확히 어떻게 다른지 설명해보려면 헷갈릴 때가 있어서 정리해보려고 한다. 1. Instance Method 우선 클래스메서드와 정적 메서드를 살펴보기 전에 인스턴스 메서드를 살펴보자. 클래스 내부에서 정의되는 메소드 중 가장 일반적인 형태는 인스턴스 메소드다. 인스턴스 메소드는 클래스를 통해 생성된 객체(인스턴스)에서 호출된다. 인스턴스 메소드는 첫 번째 매개변수로 self를 받아 인스턴스 변수에 접근할 수 있다. self는 인스턴스 자신을 나타내는 파라미터이며, 인스턴스 메소드를 호출할 때 인스턴스를 전달해야 한다. class Cat: def __init__(self, name, age, color): self.na..

Python 2023.03.12