【デジこれ10】正確で、より新しい情報を

デジタル辞書の現在とこれから」第10回は「正確で、より新しい情報を」。“定期更新と常時改訂”の話です。

※このブログ連載は、2022年7月の日本電子出版協会(JEPA)セミナー「デジタル辞書の現在とこれから」の内容を、(我ながら呆れるくらい駆け足でしたので)補足しながらまとめなおしたものです。

前の記事【デジこれ09】辞書ユーザを育てよう


国語辞典、英語(外国語)辞典、百科(専門分野)事典の別にかかわらず、言葉は次々に生まれ、常に変化しています。書籍版の場合、増刷時に修正できるのは刊行後に判明した誤字脱字と一部の誤記載に限られ、新語の追加や時事に則した加筆修正は改訂版まで待つほかありませんでした。それがデジタル版ではできます。オンライン辞書の普及や電子辞書の年度モデルの成功なども後押しして、国語辞典や英和辞典の一部でデジタル増補やプチ改訂、デジタル特化のデータ拡充が行われるようになりました。さらに進めて、常時改訂の体制を整えた上で、定期的な更新をデジタル版のアドバンテージとして積極的に進めるコンテンツが増えています。以下では、定期更新・常時改訂にあたって求められること、必要なことを整理します。

まずは、コンテンツの特性や利用者ニーズに合わせて、更新(リリース)間隔と修正規準を明確にすることが大事です。データ提供先のコンテンツ更新(可能)時期を見据えた上で、年1回ないし2回などと事前に設定しておくとよいでしょう。データ提供先の求めに応じた都度の修正と提供を繰り返しているとバージョン管理が大変なことになってしまいます。

このバージョン管理、とても重要です。定期的な外部提供タイミングを定めておいたとしても、編集サイドの都合または提供先の要請により微調整が入ることも多く、細かなマイナバージョンが発生します。結論を先に言えば、「ABC_220708.xml」のように、コンテンツコード+年月日の情報をファイル名のルールとして、納品日、査収日、提供先と提供日、簡単な修正内容のメモ等を台帳で管理しておくことが重要です。

  • データ受け渡しの際にファイルのタイムスタンプが書き換えられてしまうこともあるので、ファイル名に年月日を明記しておくことを推奨します。
  • データ提供先から(コンテンツの総入れ替えはしないので)修正箇所のみのリストを要求されることも多いようです。よく「昨年夏の納品ファイルとの差分をください」と求められるのですが、「(昨年の)どのバージョン(日付)との差分」かが重要です。
  • A社の電子辞書、B社の電子辞書、C社の辞書アプリ、D社のオンラインサービス、すべてが同じバージョンのデータが搭載されているとは限りません。最新データを提供したとしても、提供先の都合で更新が見送られることもあるためです。そのため、データ提供先ごとに採用バージョンを把握しておくことも重要です。
  • 編集部においては、追加項目および要修正事項について、改訂準備、増刷時修正、デジタル版修正の仕分け管理も必要です。早い話が、デジタル版対応も加味した訂正台本の管理ルールの取り決めと徹底です。デジタル化工程で見つかる誤り(※)も多いので、それらを訂正台本に確実に吸い上げていくことも大事です。
    ※よく見つかるパターンとして、①カッコ類の開き/閉じの不整合、②参照先とされている見出しがない/参照元と参照先で綴り・表記が違う、③項番の不整合(❷以降がないのに❶だけ残っている等)、などが挙げられます。

デジタル版とはいえ項目追加や既存項目の修正にあたっては、書籍版同様のクォリティが求められます。書籍版編集時のような幾重ものチェック・校正は難しいかもしれませんが、デジタル版修正を“応急処置”にしないよう心掛けたいものです。また、デジタル版データの修正にあたっては、検索キーワードや参照リンクなど、書籍版にはなかった要素についても注意が必要です。

増補・更新内容の“見える化”も大事です。新規項目として何を追加したか、既存項目のどのように加筆・修正したか、という情報ですね。最終的に修正に至らなくても、どのような観点で既存データを見直したか(結果OKでした)というの情報も重要です。外部提供用バージョンのタイミングも視野に入れて、短期、中長期、それぞれのスパンで項目見直しの計画を立てておくとよいでしょう。

その他、国や自治体項目等の統計情報の定期的な更新、人名項目等の肩書変更や没年チェック、デジタルデータ編集支援システム等々、触れたいテーマはいろいろあるのですが、それらは長くなりそうなので別枠でまとめようと思います。