Franck Dernoncourt
2014-07-28 08:24:50 UTC
我正在尋找一個圖書館或程序,當給定用英語編寫的文本時,它會試圖猜測作者的母語(例如,基於常見的錯誤,短語等):理想情況下,它將給出每種語言的可能性(例如0.8西班牙語,0.3法語,0.2意大利語等)。如果可能的話,免費,開放源代碼,並且可以與Windows 7 SP1 x64 Ultimate或Ubuntu一起使用。
這聽起來更像是計算機語言研究的想法,而不是軟件。如果有足夠的培訓課文,您可以使用統計方法-例如每人數千頁,每種語言數百人。當然,這是一個“不錯的”計算機語言研究理念!