韓国語OCRの現状と朝鮮本のTEI構造化にむけて
- 日時:2024年10月17日(木)14:00 - 16:00
- 開催形式:Zoomオンライン開催
- 発表者:澁谷秋(U-PARL特任研究員)
- コメンテイター:
- 杉山豊(京都産業大学 准教授)
- 兪祐植(Wafer Masters)
- 主催:東京大学ヒューマニティーズセンター
- 申込(参加無料・要登録):https://u-tokyo-ac-jp.zoom.us/meeting/register/tZcode6pqjovE9eSTothWhMy-M7YjeqeDPO5
概要
前回のセミナー(HMC第103回オープンセミナー「朝鮮本と画像処理の現在地」)では朝鮮本の異版比較を行うためにはどのような点に注目して画像処理を行うべきか報告を行った。
本セミナーでは韓国国内で開発されているOCRの現状報告と,テキストデータどのように構造化させていくべきか,TEIを用いた試みを紹介する。
関連書籍
- 一般財団法人人文情報学研究所(監修)石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郞(編)『人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて』文学通信
- 藤本幸夫(2021)『書物・印刷・本屋: 日中韓をめぐる本の文化史』勉誠出版