高分子分野テキスト解析システム

どのようなシステム?

高分子材料分野のテキストを自動解析するシステムです。 大規模な高分子学会論文を基にしたコーパスを用い機械学習したモデルが、 ガラス転移温度、弾性率に関する情報を自動で付与します。

自動付与される情報の例:

  • 物性名とその物性 (例) セルロース誘導体のガラス転移温度
  • 物性とその値 (例) ガラス転移温度は270)
  • 物性値とその単位 (例) 270℃)

システムには2種類の使い方があります。

利用は無料です。アカウントの発行が必要です。

Web UIによる利用

Web UIはウェブブラウザーから直接テキストを入力し、解析結果を確認する方法です。

1. テキストを入力し、解析を開始します。

2. 出力結果がブラウザ上に表示されます。

Web API による利用

Web APIはPythonなどのプログラムからHTTPSリクエストにより解析結果を得る方法です。

これにより、例えば大量のテキストから必要な情報を取り出したり、独自のアプリケーションを開発することが出来ます。

  • サンプルコードのようにAPIを呼び出すと、解析結果がBRAT形式で返されます。
  • 出力結果
    • 
                  入力テキスト: セルロース誘導体は270°Cに熱分解温度を示し、170°Cにガラス転移温度を示した。
                  T1	material 0 8	セルロース誘導体
                  T2	value 24 27	170
                  T3	unit 27 29	°C
                  T4	property 30 37	ガラス転移温度
                  R1	Value Arg1:T2 Arg2:T4
                  R2	Unit Arg1:T3 Arg2:T4
                  R3	AttributeOf Arg1:T4 Arg2:T1
                  

アカウントの発行

システム利用のためのアカウントを発行するためには、産総研の石垣(ishigaki.tatsuya@aist.go.jp)までお名前、所属、利用目的を添えてメールをお送りください。

後日アカウント情報をお送りします。

注意

このシステムを使った成果で論文を書く場合は,下記の論文を引用してください。

  • 高分子材料に関する技術文献からの機械学習を用いた知識獲得, 石垣達也, 上原由衣, Liu Shanshan, Topic Goran, 高村大也, 第70回高分子討論会, 2021
  • 機械翻訳テキストを用いた低資源言語特定分野向けBERTの事前学習, 石垣達也, 上原由衣,Topic Goran, 高村大也, 第21回情報科学技術フォーラム (FIT2022), 2022 [翻訳データから学習した材料科学分野向けBERTのダウンロード]