題:
用於英語音頻文件的開源語音轉文本軟件
JonDoe297
2016-07-18 19:42:51 UTC
view on stackexchange narkive permalink

我有數百小時的英語音頻文件,需要將其轉錄成相同的語言。您知道我可以用來自動自動使用的語音轉文本軟件嗎?

  • 顯然,自動轉錄不是完美的,但至少可以至少會支持英語
  • 開放源代碼
  • 它將在Linux上運行,但其他平台也可以
  • 音頻文件位於MP4上,但如有必要,我可以將它們轉換為其他格式
  • 結果應該是簡單的文本文件
  • 隱私性很重要,因此我不能使用在線服務

我想像它像一個可以像這樣使用的應用程序:

  $ transcriber --input 001.mp4 --output 001.txt  

使用這樣的代碼,可以很容易地編寫腳本來轉錄所有音頻文件。

謝謝

這是一次性轉錄嗎?使用在線服務可能會更好一些,例如[IBM的Watson Speech-to-Text](https://www.ibm.com/cloud/watson-speech-to-text):顯然不是開源的,但價格便宜,每分鐘2美分,前1000分鐘免費。
我不知道這很有趣,但是擁有開源的想法是節省一些錢,最重要的是,我不必擔心隱私問題,因為它將在我的計算機上運行。
Google搜索[語音轉文字軟件](https://www.google.nl/search?q=speech+to+text+software)給我帶來了例如轉到[頂級語音識別軟件產品](http://www.capterra.com/speech-recognition-software/),但我不知道這有多獨立/好。
[面試轉錄軟件]的可能副本(http://softwarerecs.stackexchange.com/questions/14475/interview-transcription-software)
@JanDoggen謝謝。您感動了右和弦!那就是我想要的。我在Wikipedia https://en.wikipedia.org/wiki/List_of_speech_recognition_software上找到了此鏈接。有很多選項,因此請務必嘗試一下。但是,如果有人對一個應用程序或庫有直接的經驗,我將保留這個問題。
二 答案:
#1
+2
ProjectPokket
2016-07-25 01:16:32 UTC
view on stackexchange narkive permalink

這聽起來有些怪異,但是您可以將其上傳到Youtube(假設其未經版權保護的材料),並添加其自動抄送,然後下載該文件。

很完美,但是一個可能的解決方案。

隱私很重要。我更新了問題。不管怎麼說,還是要謝謝你,
我明白。您仍然可以將YouTube視為一個選項,可以將文件設為私有(已授權,您將在線上傳該文件)。我真的很好奇,如果您找到更好的解決方案
#2
  0
aparente001
2016-08-21 21:16:36 UTC
view on stackexchange narkive permalink

我建議使用 https://transcribe.wreally.com。您的音頻文件和轉錄都不會傳輸到他們的網站,因此可以滿足您的隱私要求。您可以離線使用它,但必須在Chrome瀏覽器中使用它。 (很遺憾,它不能滿足您的開源要求。)

它與youtube的轉錄過程相似,但效果更好。

這個開源如何?您可以鏈接到他們提供的開源許可證嗎?
@ThomasWeller-我猜您錯過了我寫的“不幸的是,它不滿足您的開源要求”。 JonDoe的請求涉及許多約束。我很清楚其中之一對我的建議不滿意。
好的。我認為可以,因為您明確提到了它。如果那句話是在您的原始帖子中,那我一定錯過了。抱歉。
@aparente001我正在尋找的是一種**自動**轉錄軟件。不僅是轉錄。我的錯是問題沒有我想的那麼清楚。無論如何,我對其進行了更新並添加了新評論。謝謝。
這是一個非常困難的問題。如果它是一位發言者,說話非常清晰,並且具有良好的聲學條件,則可能是可行的。我引用的Wreally資料來源確實提供了此功能,但我尚未對其進行測試。儘管它不是開源的,但這可能是您進行現實檢查的一種方法,即檢查想法的可行性。


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...