如何抓取网页制作制作 mdx 格式韦氏词典 mdx

mdx 词典 怎么用,我在网上下载了几部mdx格式的词典文件,怎么样加载到金山词霸牛津版的软件中_百度知道
mdx 词典 怎么用,我在网上下载了几部mdx格式的词典文件,怎么样加载到金山词霸牛津版的软件中
说一下,放置文件夹的路径,而且mdx格式是否可以用在电脑软件上呀,是不是只能用在手机软件上?
我有更好的答案
mdx词库可以在pc ppc android iphone......上使用,pc可以用MDict这个软件使用路径随意,只要在词库管理中导入即可。需要下载mdx词库可以去掌上百科,词库数量超过现在任何一个词库,还有离线版维基和百度百科。
其他类似问题
为您推荐:
您可能关注的推广
金山词霸的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁正则表达式抓取网页数据制作小词典 - 下载频道
- CSDN.NET
&&&&正则表达式抓取网页数据制作小词典
正则表达式抓取网页数据制作小词典
正则表达式抓取网页数据制作小词典,抓取网页数据,制作小词典
若举报审核通过,可奖励20下载分
被举报人:
举报的资源分:
请选择类型
资源无法下载
资源无法使用
标题与实际内容不符
含有危害国家安全内容
含有反动色情等内容
含广告内容
版权问题,侵犯个人或公司的版权
*详细原因:
您可能还需要
移动开发下载排行mdict版制作方法和常用工具
mdict是显示mdx内容的工具,mdxbuilder是编译mdx源文件到mdx的工具,mdd是mdx的附加资源库文件,mdd不能单独执行。
&& 制作流程:
图文资料--整理成mdx源文件--用mdxbuilder编译转换为mdx
(mdd同时生成)--使用mdict浏览mdx(mdd)的内容。
1、mdict制作常用文本格式(mdx源文件)
mdx源文件常见格式详见附件中的示例& 示例.rar (433.41 KB)
下载次数: 605
转换软件MdxBuilder,下载地址/thread-.html
首先制作MdxBuilder转换所需的原始格式txt文本文件
最常用的是MDict的html格式
每个项目两行
第一行是关键字
第二行开始是正文,
这里的正文应该包括关键字。可以使用html的标记(不要包含&html&
&body&&/body&&/html&,
这个程序会自动加上, 另注意在转换时要指明源数据为html).
如果需要显示音标的话,可以利用html指定字体就可以显示了。(参见下面的例子)
正文结束后必须用一行&/&表示结束
例子: 1.txt
词条1标题Whole
词条1内容&font
size=5&whole&/font&&br&&font
face="Kingsoft Phonetic Plain, Tahoma"&(hol,hJl;
houl)&/font&
(注意"&/&"和下一个记录间不要有任何其他空行,请参考example.txt中的例子)
在html中连接到其它关键字的方法:
href="entry://key"&key&/a&
其中key是关键字,
词条内部跳转方法 &a
href="entry://#1"&目录一&/a&&&
(一定要有&a
name=1&&/a&相对应)
在html中嵌入图片的方法
src=file:///abc.gif&&
其中src指向的文件名大小写不敏感
并将所有图片文件放在一个单独的目录中(不要与词典源文件放在同一目录中). 数据目录中可以
带有子目录。在使用MdxBuilder制作词库时,将Data路径指向上面存放数据的目录,该目录中的
所有文件都会被压缩到后缀名为.mdd文件中,使用时该.mdd文件应当与.mdx文件在同一目录下。
MDict 3.1 支持多个mdd文件组合成一个mdd来使用
制作方法:将图片分成几个目录,然后逐个目录打包就是了。
打包后的文件名: 词典.1.mdd 词典.2.mdd&
词典.3.mdd& ......
调用方法不变。
程序在第一个里找不到,就去第二个里找。。。
加入外部样式表的方法
制作时在每个词条内容前加上
&link rel="stylesheet"
href="style.css"&
这句话,然后生成mdx
生成的mdx与style.css放在同一目录下。
style.css内容示例:
BODY { FONT-FAMILY: "宋体", "宋体", "宋体"; FONT-SIZE: 80% }
TD { FONT-SIZE: 11pt }
A:link { COLOR: #000000; TEXT-DECORATION: none }
A:visited { COLOR: #000000; TEXT-DECORATION: none }
A:active { COLOR: #ff0033; TEXT-DECORATION: none }
A:hover { COLOR: TEXT-DECORATION: none }
--------------
2、数据处理方法(生成mdxbuilder可以编译的文件,就是上面介绍的)
一、mdict编辑器网络版
& 处理好txt文本或者htm文件后,可以利用mdict编辑器
导入数据库后编辑然后再导出为mdx源文件,绿色文件解压后可直接运行。
/viewthread.php?tid=4498
支持无限多文本。& 并且支持可视化在线编辑 和在线提取、批量下载网页文件。推荐新手使用。
二、MDICT文本处理软件
简单的编辑工具
a. MDict词库可视化编辑器
(Mdx Source File Maker) V0.3
/viewthread.php?tid=609517感谢 nbdx-mmrs
网友制作此软件
b.批量文本处理程序,注意事项:每个txt文本文件的名称作为词条标题,类别处请留空(删除“AA”),下载见附件,这个缺点是有时会有乱码。
c.简易词典制作工具: /thread-.html
(感谢fdfdrere)
d、html2mdx
将html文件转换为MDict格式文件的程序!Wncable(Bowang)大侠的工具软件,可以将Html格式一次性转换成符合Mdx格式要求的Txt文件,随后便可以用MdxBuilder软件直接生成Mdx文件了!
/viewthread.php?tid=84
三、其他方法:
a.逐条输入→MdxBuilder支持txt→MdxBuilder生成(适用于制作自己平时日积月累的东西,可以生成漂亮的表格)
b.利用MdxBuilder支持的格式的词库转(适用于转现成的SugarDict,KDict词典)
c.其他→(excel)→文字编辑软件(用UltraEdit-32好于EmEditor好于word)→MdxBuilder支持的txt文档格式→MdxBuilder生成(适用于高效制作一切能方便转为excel文档的词典)
/viewthread.php?tid=179661
d. 我的mdict词库制作体会 (莲花无语 提供)
/thread-.html&
四、危机百科
原始数据:http://download.wikimedia.org/zhwiki/
危机百科转mdx源文件制作工具
/thread-.html
/viewthread.php?tid=86
危机转换工具
Wiki。ToMDict2.0
/viewthread.php?tid=86
Wi。ki2Txt V1.1
下载地址 /viewthread.php?tid=500730
五、Txt文件词条合并工具 Combine,绿色版
Wncable(Bowang)大侠的巨作,可将多个词典的相同词条合并成1个!
/thread-87-1-17.html
六、mdxexport ,将Mdx文件转换为Txt文件
/viewthread.php?tid=954
--------------
3、mdxbuilder转换信息
以上方法处理后得到的文件再用mdxbuilder转换
MdxBuilder关于选项的说明:
a) Key case sensitive
关键字(标题)是否大小写敏感。多数情况下词典是大小写不敏感的,所以不要选。
b) Allow export to text
是否允许导出为文本。如果选了,就可以用MdxExport这个工具吧词典导出为文本格式。
c) Right to left text
文字的阅读顺序。中文是从左到右,阿拉伯文之类的是从右到左。
d) Strip key
是否去掉关键字中的特殊符号。例如21世纪词典里的关键字是显示成"lis.ten"
这个样子的,如果不去掉".",则用户需要输入"lis.ten"而不是”listen"来查询单词。
这个是用来标示词典的名字,计划将来在需要显示词典名称的地方进行显示用的。但目前暂时没有用处。
f) Description
词典的详细介绍。第一次打开词典时看到的欢迎页面。
g) Build Data archive
仅进行数据文件制作。主要是用来制作图库,声音库时用。勾选后就不用填写Source路径。
h) Index block size, Record block size. 这两个是调整性能用的,用缺省值就好了。
i) Encryption Key
词典加密的密匙,用于词典授权用的。可以参见MdxBuilder.zip里的LibKeygen.txt的说明
注意事项:
1、图片链接最好使用 &img src=file:///1/1.jpg&
这样的格式
&&&&&&&&&&
2、转换出错一般是标题位置有多余的空行
&& 词条1标题
&& 词条1内容
&&&&&&&&&&
3、mdxbuilder处理转换后的mdx文档大小应在4G以下
MdxBuilder出错信息
1、出错信息:“Keyword is longer than 255 at position: XXX of the source
可能原因:标题位置缺少换行,使用编辑工具编辑并存档后,txt并未能识别你所制作的文件己隔行。
用UltraEdit打开文件按Ctrl-H进入16进制模式,然后按Ctrl-G, 再输入 XXX (就是报告错误的位置).
然后再按Ctrl-H返回文本编辑方式。。。
解决方法:再新建一个档案,然后将所有的文字复制到新的档案中;指定行处增加换行。
2、出错信息:加载正常,但转换中内存溢出。
可能原因:源文件过大
解决方法:使用mdxbuilder大文件特别版
3、出错信息:Invalid keyword at position: XXX of the source file。 Failed
to load source file, process cancelled
可能原因:标题位置出现不必要的空行。
解决方法:用UltraEdit打开文件,Ctrl-G, 再输入 XXX (就是报告错误的位置).
删除空行,空行较多可用正则表达式批量处理。
------------------
4、mdict版制作常用编辑工具软件(用来编辑mdx源文件 或 收集处理文本资料)
UltraEdit-32
UEDIT查找替换高级教程(制作电子书与MDIT辞典必看)
其实UEDIT32的搜索替换至少有两个最明显的优点:
一、执行速度非常快,是WORD的数千倍,不信你打开一个20M的TXT文档,用UEDIT替换只要3秒钟,用WORD看要不要几个钟头?
二、UEDIT的替换内容可以包括查找到的内容,这是在WORD以及更高级更专业的“微软正则表达式”所都无法支持的,不过这个应用可能大部分的朋友都不知道。
虽然许多极其复杂的文档查找与替换必须使用较专业的正则表达式来处理,但对于一般甚至比较高级的操作来说,UEDIT还是我们的不二选择。现在我来简要介绍一下UEDIT的查找与替换的高级应用。
以下的示例使用中文版UEDIT10进行讲解
UEDIT查找的快捷键是Ctrl+F(find)或ALT-F3,替换的快捷键是Ctrl+R(replace),再次查找的快捷键是F3。
2. 一般查找与替换功能:
※在查找/替换框内将“正规表达式”的√给去除,并分别在查找与替换的框格内输入所需的字符,执行查找与替换即可。
※如果需要匹配回车键,在查找框中可输入^p(注意p是小写)来代替回车键
说明:在unix格式中^n表示换行,而在mac的文本格式中^r 表示换行,dos格式中^p 表示换行,不过一般情况下^p
可以同时兼容^r 或^p
fssdf给替换为dfdf,ss,fssdf格式:可在查找中输入^p,替换中输入,(半角逗号)即可。
反之将dfdf,ss,fssdf给替换成以上三行只要在查找中输入,(半角逗号),替换中输入^p即可。
高级查找部分:
1.要记住将查找/替换框中的正规表达式给√上
2.常用的查找/替换命令:
匹配行头(0字符,仅是匹配一个位置)
匹配行尾(0字符,仅是匹配一个位置)
在一行中匹配一个单字符
匹配一个或多个字符(不允许跨行匹配)
匹配+左边的那个字符一或多次(不允许跨行匹配).&
匹配+左边的那个字符零或多次(不允许跨行匹配).
匹配DOS文本的换行符(通用)
匹配MAC文本的换行符
匹配UNIX格式文本的换行符(在wondows操作系统中一般情况下可与^p互换)
匹配单字符或字符范围
^{A^}^{B^}&&&&&&&
匹配A或匹配B
^(...^)&&&&&&&
用于替换框中代替查找的内容
/viewthread.php?tid=565520&extra=page=1&area=
EditPlus v3.1 汉化版
适合少量文本文件批处理,支持不超过50M左右的单个文件,拥有强大的正则表达式处理功能。
http://download.csdn.net/source/2301830
菲菲更名宝贝
支持文件批量、改名以网页标题更名、以文本文件的第一行更名,各种内码转换等等;
/soft/59019.htm
/Soft/ShowSoftDown.asp?UrlID=2&SoftID=7
多行文本替换工具
/files/a089fd7a-973f-11dd-96d5-f/
TextForever
编码转换,批量htm网页转txt文本
包括HTML到文本文件的转换、文件合并、文件切分、段落合并、段落切分、内码转换(只能在Win
2k/XP下用)、文本替换、HTML整理、文本抽取、正则表达式(需要IE
5.5以上版本的支持)、批量OCR、tcr文件压缩/解压等功能。
http://download.pchome.net/utility/file/editor/download-83578.html
teleport pro& 网站网页抓取软件
Pro可以从Internet的任何地方抓回你想要的任何文件,它可以在你指定的时间自动登录到你指定的网站下载你指定的内容,你还可以用它来创建某个网站的完整的镜象,作为创建你自己的网站的参考。
Name:greendown&&&&
/download/view-software-1446.html
.cn/tracky/article.asp?id=38
wget绿色版下载工具
是一个从网络上自动下载文件的自由工具。
wget可以跟踪HTML页面上的链接依次下载来创建远程服务器的本地版本,完全重建原始站点的目录结构。这又常被称作"递归下载"。在递归下载的时候,wget遵循Robot
Exclusion标准(/robots.txt). wget可以在下载的同时,将链接转换成指向本地文件,以方便离线浏览。
wget非常稳定,它在带宽很窄的情况下和不稳定网络中有很强的适应性.如果是由于网络的原因下载失败,wget会不断的尝试,直到整个文件下载完毕。如果是服务器打断下载过程,它会再次联到服务器上从停止的地方继续下载。这对从那些限定了链接时间的服务器上下载大文件非常有用
已投稿到:本类周下载排行
本类月下载排行
热门关键词
MDX词典格式转化软件GetDict 2.3 中文版
MDX词典转化工具|软件简介 Soft Introduction
【概括介绍】GetDict是一款非常不错的MDX词典转化工具,可以将Mdict的mdx格式转化为可编辑的txt文本格式,供用户编辑使用。【基本介绍】mdx是MDict软件的词典文件,相当于一个电子书。它无法转换成视频,因为都是文本文件。只要手机安装MDict,就可以打开mdx字典了,在电脑端可以使用Mdx文件制作工具MdxBuilder进行编辑。【MDict词库制作方法】第一步是要从MDX格式的词库中导出txt格式的文本,才能对它进行编辑,几经查找和尝试,终于找到GetDict.exe,导出了txt文本,它是每个单词一行的Html+C的格式,方便把不同来源的单词分开,但不是MDX所要求的源文本。为了把无用的单词去掉,我需要对它进行处理。由于这个文件太大(约890M),家里的电脑不能装UltrEdit,其它软件都打不开它(单位的电脑能装,但处理效率太低),经过研究,终于找到了Linux下的Grep可以完成此项任务,并且速度超快。由于合集中的词库太多,都需要手工选择,所以还是花了好几个小时的时间才把每个词库分开,分别保存为一个一个的文件。从中选出了15个对我可能有用的词库,进行下一步的处理。(由于不熟悉,没有人指导,都靠自己摸索,前面这些工作花了一整天加半个晚上的时间)。第二步是对那15个字库的源文本进行加工。为把源文本转换为MDX需要的格式,使用了MdxBuilder,先将其转换为MDX文件,选项里选上“Allow export to text”,然后用用MdxExport.exe将上一步得到的mdx文件转换为txt文件,即得到了MDX所要求的“每单词三行”文本格式。但里面有很多\& \& \& \& 需要替换为 & & & &后才能用。这个环节又花了半个晚上加一上午,才把15个文件整理完毕。这个过程使我对正则表达式有了一些了解,对NotePad++也熟悉了一些:NotePad++的搜索替换速度很快,能使用正则表达式,但缺点是文件太大后(约100M),经常执行一半就异常退出了。为了处理一些大文件(约140M),我不得不把文件分成两个,再进行处理。第三步,使用MdxBuilder将处理完毕的词库文本文件进行转换,得到最终MDX格式的词库文件。完成所有任务。
如果您觉得此软件好,请
如果您觉得此软件差,请
依次点击下面广告进入 →MDX词典格式转化软件GetDict 2.3 中文版
← 下载列表 Soft Download URL
MDX词典格式转化软件GetDict 2.3 中文版电信下载: 联通下载: 移动下载: 专用下载:
相关软件 Related Software
注意事项 Attentions
如果您发现该软件不能下载,请.
为了保证您快速的下载,推荐使用[]等专业工具下
为确保所下软件能正常使用,请使用[]或以上版
本解压本站软件.
站内软件包含破解及注册码均由网上搜集,若无意中侵犯到您的权利,敬请来信
如果下载回来的部分压缩包需要解压密码的话,解压密码就是:
本站设有电信网通多台服务器负载均衡,如果出现无法下载请稍后再试一下!
服务器赞助商 Server Provider

我要回帖

更多关于 韦氏词典 mdx 的文章

 

随机推荐