歸國跟回國有沒有可能不是刻意攻擊,而是中國使用者就是那樣用,學習的結果? 因為中國人就算出了國,跟外國人講中文的話都還是會這樣說話(省略國名,只說「回國」、「國內」),好像全世界都會知道他們在講的國就是中國。一開始我以為是他們不認為我是外國人所以對我這樣講(每次都很想翻白眼說你國內不是我國內),後來聽一個馬來西亞人說他們對他也會這樣說話才知道是他們的習慣(不過並沒有因此就覺得合理)。 那如果中國使用者在網路上問要怎麼用英文說有「回國」的句子,得到的回答當然就會是 return to China 而非 return to the country。
提醒:下文極長
更新:目前有發現其他被影響的內容,如果還有發現這類狀況,麻煩大家用「意見回饋」或「提供意見」回報給Google。
以正規第一種方法,非監督式學習,我們並不清楚它在學習時,裡面進行、經歷了些什麼。
另一種方法是監督式學習,就是透過像前面提到的誤導手段,給特定句子,要求吐出特定答案,只是這次是要求是正確的答案。
謝謝噗主
為了一個句子,而且還要相同字眼,搞這麼多值得嗎
我們都覺得噗主
努力修正很可愛,謝謝您的說明,辛苦了!當時的作法是用英文寫憤怒的反饋(?)給google,很快就修正了
這種簡單句子還需要用軟體翻的人一定是其中一邊幾乎看不懂的人,中翻英就算了,中文使用者學習英文到可以理解這種程度句子的人應該不在少數,但是英文使用者呢? 雖然說英語圈最近幾年學習中文的人大增,但還是遠遠不及中文使用者使用英文的比例。
那是在甚麼情況下"英語使用者"會需要這幾個句子"翻成中文"來用呢?
看過google地圖一些地方被神祕改名之後就會覺得,有心搞這種事情的對方一定不在少數
搞這種小動作的團體真的噁心…
大陸那是有一組懂電腦的網路軍隊,有這種能力我不覺得奇怪
畢竟也不可能有證據
但大陸自己也有人說
「中國網路封鎖是為了保護外國人」
這點我深表認同w
畢竟一般而言普通中國人不翻牆是無法使用google的
是一天內也有十萬多筆手動修正翻譯影響的意思嗎?
不好意思對這部分不是很了解 想詢問一下><
抱歉想離題請教下各位
像近幾年google翻譯的一般生活用語也都變成中國式
但實際上google在翻譯這些單詞時
可以依簡繁體或使用者的國家地區而改變翻譯結果嗎?
這根本沒完沒了
他們到底還改了多少東西
又來一個新的(怒)
所以目前被改錯(sad在特定語句下改成高興)是因為得到大量錯誤樣本
那麼被修正成現在這樣正確的是因為同樣有大量修正回饋嗎?
被改錯與改對的修正機制是一樣的還是不同的呢?
目前不懂如果被改錯需要十萬甚至百萬的錯誤樣本 那如何在一天內被立刻修正的?
再麻煩大家幫我解惑QAQ (也感謝各位的努力!!!
但您也可以看到我們上面的討論了,他們投的錯誤樣本已經對整個辨識用的神經網路已經造成了整體性的影響,基本上神經網路在訓練上造成的影響都是永久性的,所以可以說,改對和改錯是可以用同樣的方式,就是投樣本給它學,但前面也提到的,造成的影響是永久性的,所以改錯簡單,但要完全改回來(改對),基本上是不可能
剛才嘗試了一下very h to see hong kong
就直接被翻成 很高興看到香港
可是將 h 改成 hohohoho 就不會顯示高興
同意應該加入機器人認証
另外我覺得即見所得功能有點煩,恢複成以前的按鍵才翻譯這樣有可能嗎
1.他們的翻譯用神經網路最早是基於RNN
2.翻譯社群有防範機制
3.翻譯社群如果有極大量同樣的樣本在短時間內進來時,後端會自動做機械學習
我很希望他們可以公布他們的整個流程和一些神經網路的資訊,而且他們之前有一次大更新,讓整個網路從12GB降到1GB多,我很好奇他們那次究竟有哪些技術上的突破。
附帶一提,那東西用了半年,設定固定11:45報時提醒我們吃午餐,現在延遲到可能要11:55才會提醒。
百度:「天安門」「事件」「在六月四日」
google:「天安門」「廣場」「事件」「在六月四日」
歷史事件名翻譯精準度,後者較前者高
google昨夜深夜也有回應說他們正在查
但這個詞彙照上面說的來看真的影響很大,有夠惡意
德性匹配下場
很高興見到香港"
這個也被影響了
這個沒有被影響耶
「為了騙過AI,支共把謊話說了幾百萬遍。」
Transformer model for language understanding | Ten...
已經立即提出修改建議
426不知從哪來的用錯誤的翻譯 來狂洗資料 ... 所以 Google 翻譯 中英翻譯是 shit 得證 ??丟一下連結,大家多回報一下吧
原來上次看到這種翻譯還有這麼多更誇張的嗎...
反正中國官大多子女是拿了綠卡不知道怎麼洗的
另外在香港抗中事件爆發之前,其實我個人使用google翻譯時就有發現如果中文寫「回國」,翻譯是 Returning to China
然後你說的對,拜託他們政府牆封緊一點吧,他們絕大多數會翻出來的人都常常破壞其他人網路使用的感覺,常常打個遊戲他們就在那麼破壞人家好好打遊戲的氣氛。
也會跑出一堆中國的旗子 這也是同一種原理嗎…
就一起努力吧!
把一個養好的模型給弄歪真心不能原諒QQ
太晚看到了()
測了一下中翻日的我國也會變中国,超噁
因為中國人就算出了國,跟外國人講中文的話都還是會這樣說話(省略國名,只說「回國」、「國內」),好像全世界都會知道他們在講的國就是中國。一開始我以為是他們不認為我是外國人所以對我這樣講(每次都很想翻白眼說你國內不是我國內),後來聽一個馬來西亞人說他們對他也會這樣說話才知道是他們的習慣(不過並沒有因此就覺得合理)。
那如果中國使用者在網路上問要怎麼用英文說有「回國」的句子,得到的回答當然就會是 return to China 而非 return to the country。
所以大家別灰心!
除非我們寫信去投訴用語,但說實話接到中文投訴信回覆人員也是中國人
倒是英文已經不會出現幹爆鴨子這種笑話了
繁體提供修正真的很無感
這個應該很多人知道,因為有簽保密條款,要不因為這是密噗,而且有這麼多人這麼激動,我也不想講。還有,使用繁體的除了台灣以外、像新加坡用語以及香港,因為發音的關係,寫出來的詞語就會不同,聲音辨識訓練還要另外做。這個噗的原意是要解釋發生了什麼事,誠心希望不要因為大家太激動就被刪噗了~
(懷疑是我平常太常檢舉對岸的廣告其實我比較想知道的是如果繁簡有分開為什麼在平常使用時會出現這麼明顯偏向簡體用法的狀況……如果是其它地區的繁體使用者會有自己的使用習慣吧,但似乎是不能說的一部分唉……
Google翻譯硬要給我簡體中文選項,我就跟它耗,連續十幾二十分鐘,甚至半個小時重複把右側框框上面選成繁中、英文、日文→重整→F5,跳出簡體中文就重來,現在Google就不會給我跳出預設簡中選項了
然後推測分開訓練但還是混了對岸用語,理由搞不好跟噗首那個攻擊行為有關(突然想起來大學某次期末考用Google翻譯在
臨時抱佛腳,不但Google翻譯堅持要在右邊框框上面放簡中,消都消不掉,還所有的英文打進去,不管是一般用詞,還是生物醫療領域的用詞通通不但變對岸用語而且還都是簡中我保證不是在簡體環境下下載這個APP的。
我出現在這唯一要反應的就只有這句話,這件事情,google絕對有問題,幫共犯脫罪真的很不必要,言盡於此。