try another color:
try another fontsize: 60% 70% 80% 90%
Mobabel
Build one Babel Tower in the mobile world to communicate!

Mdict转StarDict格式

12 posts / 0 new
Last post
webmaster
webmaster's picture
Offline
Joined: 02/14/2008
Posts:
Mdict转StarDict格式

1、用MDictPC(下载)打开想要转换的mdx格式词库,将MDictPC最小化。

2、打开Mdx2htm.exe,这个工具是用来导出mdx中的内容,确定后在输入框中填入0~100之间的数值,此数值的含义是导出两个词条之间的时间间隔,数值越小导出速度越快,当然,也更占资源。

3、经过一定时间(视词条多少及计算机配置而定,平均1分钟可以导出5000个词条)的等待,将会在保存Mdx2htm.exe的目录下生成mdx2out.htm文件,这个文件中的内容就是mdx中的内容。

4、上述mdx2out.htm的末尾有很多重复词条,需要用文本编辑器,如UltraEdit(下载)将其删除,产生重复词条的原因是由于导出工具在导出时经过100次的迭代后,如都是同一个词条的话,确定mdx导出结束。

5、上述mdx2out.htm中有许多不必要的换行,需要用文本编辑器,如UltraEdit(下载)将其删除,删除方法是替换^p^p为^p。

Ref:
http://home.ustc.edu.cn/~wchao911/tool.html
http://blog.163.com/zsl-oo7/blog/static/3532970320110232417791/

hunnitth
hunnitth's picture
Offline
Joined: 04/09/2011
Posts:
能有详细一点的内容吗? 主要关于怎么把导出来的内容制作成S

能有详细一点的内容吗?
主要关于怎么把导出来的内容制作成StarDict的格式,在Windows下能做吗?还是要安装个Linux来用
作为一名英文学习者,找不到可以的合适词库。虽然有大量的词典,但是竟然找不到一个像样的学习者词典!
比较想要OALD8(直译是牛津高级学习者词典8版,原版英英词典)和LDOCE5(朗文当代英文词典5版,也是英英)
这2个都用MDict的格式,感觉非常完美。就算不要里面的图片和发音,只有文字和排版也非常优秀,很适合中等水平学英文的人用,但是找了半天找不到StarDict的格式
虽然StarDict有个牛津,但不是OALD,似乎是ODE,解释不容易看懂,也没有足够的例句
非常期待一个完善的转换方法
现在我连买iPad+Mdic当词典用的心都有了……

webmaster
webmaster's picture
Offline
Joined: 02/14/2008
Posts:
看来Mdict在国人心里的地位是不可替代啊,可惜作者不愿意

看来Mdict在国人心里的地位是不可替代啊,可惜作者不愿意公开词库格式(我联系过)。
如果格式公开,支持Mdict的词库也不是难事。
上面的方法我也没有试过,不过这个方法肯定是在windows下面可以做的。

hunnitth
hunnitth's picture
Offline
Joined: 04/09/2011
Posts:
MDict的词库资源太丰富了 最近Android上还有个词

MDict的词库资源太丰富了
最近Android上还有个词典叫做QDict,支持Mdict的格式(其中mdx支持的很好,mdd还不行),但是还有很多缺陷,比如经常崩溃的
我倒是很好奇那个人怎么做出来的……
另外我看到你的一个贴提到用jStarDict的词典的在线安装功能下载,然后导出成StarDict格式
其中我看到对于已经下载的词典的Type里面能设置“stardict”、“mdict”、“kdic”、“tab”、“dicf”
那么是否意味着利用这个软件有可能实现把mdict词典转换成stardict格式?
但是我还没能把mdict格式的词典导入到jStarDict里边

webmaster
webmaster's picture
Offline
Joined: 02/14/2008
Posts:
jStarDict里面支持的mdict是另外一种词典格式,

jStarDict里面支持的mdict是另外一种词典格式,同名而已,格式不同。
QDict支持Mdict我也看到了,估计是作者破解了Mdict词库的格式,我之前写信过去问,没有回复,估计是不愿意共享研究结果吧。 国内的程序员都挺保守的,你知道的,呵呵。
我个人也没破解词库格式方面的经验和时间, 要是都能象stardict作者那样就好了,至少词库格式可以公开嘛。
mdict转stardict格式,估计只能按上面的方法来转了。

mikeyaomikeyaom...
mikeyaomikeyaomikeyao's picture
Offline
Joined: 04/23/2011
Posts:
我知道怎么转

我有办法把mdx转成stardict或者tab号的纯文本,但是发音和图片是转不过去的,另外我到处都下不到oald8 preview.mdx那个文件如果你能把oald8发到我邮箱我就可以帮你转好那个的inf,idx,dict,tab发给你,用的是正则表达式,邮箱你回复我再发好了。LDOCE5我也有转好了的,android下用colordict查看

hunnitth
hunnitth's picture
Offline
Joined: 04/09/2011
Posts:
Great! 楼上的你真的可以做到吗? OALD8

Great!
楼上的你真的可以做到吗?
OALD8 Preview 我有,需要的时候在qdict lite上边看,不过那个软件频繁的崩溃就是
最喜欢的就是LDOCE,其次OALD
能留个邮箱联系吗?我的邮箱-是xfy然后四个1,gmail的
(请原谅我没有直接完整的写出来,因为那样就容易被机器搜索到然后就是一堆的SPAM了。

webmaster
webmaster's picture
Offline
Joined: 02/14/2008
Posts:
大家如果有词库可以在

大家如果有词库可以在 fileshare等文件共享网站上面,这样大家下载都方便,用国内的服务也行,防止被墙。
俺邮箱对大文件接收一直都有问题。
突然发现是不是要装一个站内短信插件方便大家......

mikeyaomikeyaom...
mikeyaomikeyaomikeyao's picture
Offline
Joined: 04/23/2011
Posts:
这个论坛是做什么的呢?或者是不是论坛呢?我是为了了解sta

这个论坛是做什么的呢?或者是不是论坛呢?我是为了了解stardict里头一种html格式的写法搜到这里的,然后帮楼上转了两个词典,这里是不是和modict有关系呢?如果是的话在哪报告bug呢?

webmaster
webmaster's picture
Offline
Joined: 02/14/2008
Posts:
这里就是论坛啦

mikeyaomikeyaomikeyao wrote:
这个论坛是做什么的呢?或者是不是论坛呢?我是为了了解stardict里头一种html格式的写法搜到这里的,然后帮楼上转了两个词典,这里是不是和modict有关系呢?如果是的话在哪报告bug呢?

这里就是论坛啦,有bug或者任何有关词库,软件的问题都可以在这里发贴

mikeyaomikeyaom...
mikeyaomikeyaomikeyao's picture
Offline
Joined: 04/23/2011
Posts:
那我就在这写,不单独开贴了,楼主可以任意转移或删掉,首先之

那我就在这写,不单独开贴了,楼主可以任意转移或删掉,首先之所以反映bug主要还是因为觉得试过所有的词典后就这个和colordict有前途,colordict最大的缺点是不能发音而且越升级越慢,modict最大的优点就是真人发音,但是颜色黑底白字真的看着没有白底黑字舒服,亮色选项又有bug,首先我的设备有两台,三星i5700 spica 2.1rom和malata zpad t2 2.2rom,其中第二台是平板机, modict 1.17未付费版(要是能解决的话我就付费…………) 两个设备表现一样所以不区分了,首先在默认颜色下显示释义页面只要用手一接触屏幕就会所有的白色字都消失只留下绿色的音标,几乎全屏变黑,松手就又恢复,仔细看好像字上蒙着一层很深的灰绿色,亮色模式一进释义并不是亮的,而是除了绿色的音标外全黑,只有按着屏幕才会变白底黑字,个人十分喜欢白底黑字所以这个搞得我很崩溃,市场里有一款fora dict那个色调才应该是亮色.另外好像妙记也有同样问题.能联系到开发者我太激动了

mikeyaomikeyaom...
mikeyaomikeyaomikeyao's picture
Offline
Joined: 04/23/2011
Posts:
ok切入正题,关于词库的转换,首先我认为开发者不应该过多的

ok切入正题,关于词库的转换,首先我认为开发者不应该过多的介入词库的发布,而应该多讲解词库结构和制作(我不是开发者啦),原因很简单,开发者是获利的而且目标大,容易被告,就像raymanzhang那样就很好.第一步到vc去把mdict所有的20g词库都下下来备用,然后第二步就是楼上说的那个导出,注意mdx里头有些词有问题会导致导出失败,只产生部分文本,这时把已导出的文件改名加个1,用notepad或utral edit打开找到最后一个词,重启mdict查这个词却进入这个词后两个词然后再选回这个词,再继续导出,直至把所有都导出,然后合并所有的为一个有很多<……>的文本然后去学点正则表达式,找一个性能好的正则表达式替换器,按顺序执行下述替换注意无所有双引号"<"BR">"转为"\\n","\n\r\n"(还是rnr记不得了)转为"\t","<.*?>"转为空,转换完成后文件大小会变为十分之一,形式变为tab号纯文本,然后存成utf8就可以用stardicteditor转了