- ELAN即席入門 -

他のソフトのデータを読み込む

 ELAN以外のソフトを使ってきた人の手元には、すでにトランスクリプトのデータがたくさんあるはずです。それを死蔵するのはいかにももったいない。というわけで、ここでは、簡単なテキストデータをELANに読み込む方法について説明します。

タブかコンマで区切られたテキストを読み込む


 ELANには、さまざまな形式のデータを読み込むメニューがありますが、いちばん簡単なのは、「カンマ区切り/タブ区切りファイル」です。
 まずはデータのエンコーディング形式をUTF-8にします。(これをしないと、読み込んでくれません)。テキストエディットでいったんファイルを開き、保存するときに、「標準テキストのエンコーディング」をUTF-8にしておけば、UTF-8でエンコーディングされたファイルになります。

 一行のデータには、「開始時刻」「終了時刻」「注釈」の3つの要素が入っているといいでしょう。要素の順番はこの通りでなくても構いません。
 さらに「行為者(たとえば「太郎」「花子」「A」「B」など)」「行為の名前(たとえば「speech」「gesture」など)」などが入っているといいでしょう。これらを注釈層の名前として指定する(図1)と、別々の注釈層にレイアウトしてくれるので便利です。

 テキストファイルが準備できたら、ELAN上で「ファイル→読み込み→カンマ区切り/タブ区切りファイル」を選んで下さい。うまくいけば、各要素を何に割り当てるかを決める以下のような画面が出てきます(図1)。

default_grid.jpg

図1: タブ区切りテキストを読み込んでいるところ。

既存の映像、音声ファイルと結びつける


 ELANでデータを読み込むと、それは新しいウィンドウに表示されて、そのままでは映像や音声ファイルと結びつきません。そこで、読み込んだあとには、「編集」>「リンクファイル」メニューを使います。 追加変更したいファイル(複数可)を選んで「適用」させればオーケー。
 保存するときは、eaf形式のファイルで保存しておけば、次回からは自動的に映像と音声が結びつきます。
 注釈、映像、音声の位置がずれているときは、位置を微調整できます。「注釈、映像、音声をずらせる。」をご覧下さい。

ELAN即席入門(トップ)へ