【2024年版】AIを使った文献検索ツール③ Elicitの使い方【動画解説付き】

今回も引き続きAIを使用した文献検索機能のツールelicitを紹介してみたいと思います。

学術文献に特化しており、表も見やすく使いやすいのですが、初回の試用以外は有料なのが難点となっています。

動画による解説も以下にありますのでよければご覧ください。

Elicitとは？
料金
基本的な機能と使い方
臨床医学に対する実際の例
まとめ
参考文献

Elicitとは？

Elicitは学術的な文献に絞って検索を行うAIツールです。アメリカの非営利企業であるOughtによって2021年に作られました。機械学習により論理的思考を高めることを目標としており、Elicitはその一環として生み出されたものです¹。

また、今後の計画についても公式サイトに書いてあり、特色としてアウトカムベースではなくプロセスを重視してることなどが語られています。これからの方向性についてもうかがい知ることができます（とはいえ2022年の記載のようですが）²。

Elicitは入力されたプロンプトを元に、キーワードを生成し、それに対する回答を引用文献付きで記載します。ぱっと見は以前紹介したScispaceのLiterature Review機能と似ているかもしれません。

ですが、こちらの方が論文の質や種類によるフィルタリングやソースの追加・削除といった機能には優れており、データソースも異なります。

Elicitのデータソースは公式サイトで明言されており、主にSemantic scholarです³。

Semantic scholarは機械学習を活かした文献検索ツールで2024年現在で2億以上の文献がストックされています。文献情報としては幅広く集められていますので、概ね自分の読みたいような論文は含まれていることが多いです。

逆に学術文献限られているため、成書などは含まれない点には注意が必要です。

料金

さて、個々の機能の説明に関連するので、先に料金体系について述べておきたいと思います。

elicitは基本的に有料です。
お金を払って毎月もらえるクレジットを使って検索や要約を行います。初回お試しのBasicプランであれば無料で5000クレジット手に入りますが、それ以降はお金がかかります。

Elicit plusのプランでは年間契約なら月$10、月々の契約なら月$12となっています。お金を払うと毎月12000クレジットが手に入ります。

このクレジットがどのくらい役に立つかですが、公式ページに概ねどの程度の機能でどの程度クレジットを消費するかが書いてあります⁴。

機能の説明はそれぞれ後述しますが、大体以下のような感じです。

論文を見つける：50〜120クレジット
PDFからデータを抽出：アップロードする論文の数、長さ、抽出するデータに依存しそれぞれ
要約リスト：500〜2500クレジット
表への列の追加：1セルあたり30〜100クレジット
高精度モードでの表への列の追加：1セルあたり200〜500クレジット

要約した表に列を追加したりすると結構かかりますし、これが10～20くらいの論文を含む表ですと一気に1000近く消費します。

正直何も考えずに使うと12000クレジットもすぐなくなるのではないでしょうか。追加購入もできるようですが、さらに費用がかさむとなると中々高い印象はあります。

基本的な機能と使い方

主な機能は以下の３つです。

Find papers(文献検索)
Extract data from PDFs(アップしたPDFからの抽出)
List of Concepts(専門的な概念のリストアップ)

それぞれ見ていきます。

Find papers（文献検索）

まずは中央の"Find Papers"のフォームから文献検索ができます。上述した通りElicitの回答は構造がscispaceに似ています。

まず中央のフォームに質問をインプットします。

すると質問が簡易的なキーワードとして整理され、回答とその引用文献が並びます。

それぞれの論文をクリックするとアブストラクトとSemantic scholarへのリンク、DOIが表示されます。
また、pdfファイルが入手可能な論文についてはその場で全文を読むことができます。

引用文献の追加・削除もその場でできるので、さっと見て関係あるかどうかを判断し、この画面に残しておくかどうか取捨選択できるのは良い点ですね。また、それなりに古い論文も含め、オープンアクセスかどうかを問わず、幅広く抽出されていることが分かります。

文献のフィルタリング機能と要約

表示した引用文献について引用回数や新しい順・古い順などのソート機能はもちろんのこと、フィルタリング機能も充実しており、年代やジャーナルのクオリティ、研究の種類（メタ解析、システマティックレビュー、ランダム化比較試験など）によって選別することができます。

ジャーナルのクオリティはSCImago journal rankという格付けによって分類されます。このランク付けでは過去3年間の引用回数などを用いていますが、単純な引用回数だけではなく、引用しているジャーナルのランクも考慮していることが特徴的です⁵。このフィルタでは調べたい分野におけるジャーナルランクがQ1-4のどの四分位範囲に入るかで選別することができます。

四分位範囲について分からない人は手前みそですが、運営中の医療統計YouTubeも観ていただけますと幸いです。

さらに引用論文は表の形で要約されて提示されます。なお、要約は単純に論文の主張を要約したものではなく、「検索したキーワードに関する内容の要約」となっていますので、論文そのものの主な内容とは異なる点に注意が必要です。

Elicitではさらに、この引用論文の要約したい内容を追加したり、特定の内容を抽出したりすることもできます。例えば被験者やどこで研究が行われたか、など知りたい情報に応じて内容を抽出＋要約することが可能です。

この辺りの細かい機能は公式のYouTubeチャンネルの解説もかなり充実しているように思います。

サイトによるYouTube公式チャンネル→ https://youtu.be/6C6wJfvvPlw

過去の検索内容の確認

以前に行った検索内容の確認はNotebookページからみることができます。

こちらで過去の検索内容がみられるほか、クリックすると引用文献と回答も確認できます。

ここで各項目を押して、add new stepを押すと新たに追加したキーワードも並べてみることができます。

Extract data from PDFs（アップした論文からの抽出）

文献検索以外の機能として手持ちのPDFファイルをインポートし、文献検索の際に出てきたような表形式でのまとめをしてくれます。ホーム画面の"Extract data from PDFs"を選びます。

ここでまとめたいPDFを選択し、表を作ることができます。最初に一覧を作る際にはクレジット消費はありませんが、表に項目を追加するにはそのたびにクレジットの消費が必要なので注意してください。

さらにこの表の画面から個々のPDFを選択して、要約をしたり、別の表を作ったり、（β版ですが）PDFの内容について質問することもできます。
なお、要約の言語は英語しかありません。

表を作るためのPDFはLibraryというストック場所から選ぶこともできます。

Libraryのページでは手持ちのPDFファイルの論文やZoteroからの取り込みができ、タグをつけることで分類して整理することもできます。

Zoteroからの取り込みができるということで、Zoteroユーザーで良かった、、、と思ったのですが
ここで注意が必要なのはZoteroの公式ストレージかWebDAVを使用していないと、どうやら同期ができないようです⁶。

PDFファイルの元データにアクセスできないといけないからだろうと思います。
Zotfileを使ってクラウドにあげているユーザーにとってはこの点はイマイチと言わざるを得ません。。。

ちなみに紛らわしいのですが、Libraryページからはこの表を作ることはできず、ただPDFを眺めて整理することしかできません。

List of concpets（専門的な概念のリストアップ）

もう一つは何らかのトピックについて横断的に文献を検索し、関連する概念をリストアップしてくれる機能です。
公式ページの例では"effects of invasive species(外来種の影響)"が挙げられています。

今回Diagnostic marker for dementia(認知症の診断マーカー)という単語で検索をしてみました。結果は以下のようになっています。今回の例ではNeurofilament light chainといった生体内のバイオマーカーからMoCAという定番な認知機能スケール（質問の検査で行う）ものまで幅広く検出されました。