百度翻译为什么不好用

机器翻译是我每天必不可少的工具,因为要批量翻译一些资料,在各个翻译引擎的页面上翻译,太慢了,所以我自己买了三家的翻译(google, baidu, tencent) api ,在调用 API 的过程中,发现百度翻译在使用体验上是最差的,他会删除换行的格式,删除自己翻译不了的特殊字符,我同时也把这些问题反馈给了百度翻译,因为我也在百度工作过,希望他们做的更好。

不保留原有格式

这一点百度做的非常不好,比如我要翻译的原文如下,在腾讯翻译、Google 翻译里面,翻译的结果里面是保留了原文的换行,只有百度翻译,他是自动把多个换行符变成了一个,所以你一看就能看出来,格式没了,我试了一下百度的 api,也是同样的效果,不会保留换行符,我猜他是把换行符当作分段来翻译,如果遇到一个换行符,没有别的内容,只有一个换行符,他直接给你删除了。

原文

Here, s is the original or given string, old is the string that you want to replace. new is the which replaces the old, and n is the number of times the old replaced.

Note: If old is empty, it matches at the beginning of the string and after each UTF-8 sequence, yielding up to k+1 replacements for a k-rune string. If n < 0, there is no limit on the number of replacements.

Example 1:
202111251mYT3z

百度的翻译结果

可以清楚的看到,百度的翻译结果没有了格式,多行变成了一行,非常难看。

20211125plo1i0

腾讯的翻译结果

腾讯的翻译保留了换行的结构。

20211125x5SUTI

Google 翻译结果

同样,google 也保存了换行的结构。
20211125MDavVn

删除特殊字符

比如,Ȁ 是一个 unicode 字符,百度翻译他直接把这个字符给我删掉了,这就有点过了,不管是 Google还是腾讯,都把这个不用翻译的字符给我返回来了。

20211125QMRP1l

腾讯特殊字符的翻译结果

腾讯的翻译在没有删除特殊字符,但是整个翻译的结果变了
20211125daN73L

Google 特殊字符的翻译结果

Google 在遇到特殊字时,不影响整体的翻译结果。
202111255Abg2a

发表评论