辞書専用XML規約「LeXML」


LeXML

辞書および事典類の構造化を目的としたXML仕様「LeXML」(LEXicographical eXtensible Markup Language)を策定しています。 2002年の公開以降、数多くのレファレンス系コンテンツのデジタル化に採用され、国内デジタル辞書のデファクトスタンダードとなっています。

「LeXML」JEPA:ebookpedia

2020年3月時点のLeXML採用コンテンツ数は以下の通りとなっています。

国語系 国語、類語、ことわざ、古語、漢字など   81
英語系 英和、和英、英英など 116
外国語 フランス語、ドイツ語、スペイン語、イタリア語、中国語など   82
事典 百科、新語、人名、地名、専門分野ほか 229
合計 508

その他、LeXML形式以外での辞書・事典類のデジタル化(XML化)実績は262コンテンツです。

最新版「LeXML ver.3.0」資料のダウンロード


LeXMLエンティティ

特に辞書コンテンツに頻出する、 語義番号などの記号類、 発音記号、 変音記号つき文字など、 ユニコードで直接入力できないものも含めて約700種を 編集しやすい名称の実体参照形式として整理しています。 “外字”情報のXMLデータへの埋め込み記述やデータ受け渡し時の管理コストが格段に軽減できます。 LeXML仕様書の付属文書として公開しています。

変音記号付アルファベット

á = á  à = à  â = â  ã = ã  ä = ä  ā = ā  ă = &abrave;  ǎ = &acaron;  ȧ = &aodot;  ạ = &asubdot;

特殊なアルファベット

ᶏ = &ahook;  ɐ = &aturn;  æ = æ  ɲ = &nltail;  ø = ø  ᴙ = &Rrev;  ß = ß  ð = ð  Þ = Þ  ǚ = &uuml_caron;

発音記号

ɔ = &openo;  ə = &schwa;  ɚ = &schwa_hook;  ɡ = &scriptg;  ŋ = ŋ  ʌ = &vturn;  ʒ = &yogh;  ʃ = &esh;  ː = &length;

記号

¡ = ¡  ¿ = ¿  © = ©  € = €  ‰ = ‰  ↔ = ↔  ℓ = &litre;  ✓ = &tick;  ♠ = ♠  ♮ = ♮

数字

½ = ½  1/10 = &frac1_10;  ① = &wc1;(WhiteCircle1)  ❶ = &bc1;(BlackCircle1)  = &bs1;(BlackSquare1) 

その他

ε = ε  έ = &epsilonacute;  ɝ = &epsilonrev_hook;  ς = ς  髙 = &lxHashigoTaka;  鷗 = &lxShinaKamome; 

※一部デバイスでユニコード文字が正しく表示されない場合があります。

最新版「LeXML ver.3.0」資料のダウンロード


IEC 62605

LeXML(ver.2.0β)は2011年に辞書データ交換フォーマットの国際標準規約「IEC 62605 ed1.0 : Multimedia systems and equipment – Multimedia e-publishing and e-books – Interchange format for e-dictionaries」の本体記述仕様として採用されています。 2016年2月にはLeXML ver.3.0とほぼ完全に同期した「IEC 62605:2016(ed2.0)」が発行されました。

IEC 62605:2016 | IEC Webstore