今回はAIを使った検索ツールで、文献検索にも使えるperplexityを紹介します。
かなり便利なツールなので、文献のみならず、分からない専門用語の意味を調べたり、普段の検索でも役に立つこと間違いなしだと思います。
今回も約13分の動画による解説を入れておりますので、良ければこちらも見てみてください。
Perplexityとは?
Perplexityとは「困惑」「難問」などを意味する英語で、ChatGPTなどの言語モデルにおいて指標の専門用語としても使われる単語です。おそらくそのことから名づけられているのではないかと思います。このツールが特徴的なのは、ウェブ検索のような形で、簡潔かつ迅速に質問に対する回答を用意するだけでなく、引用をきちんと引いてくる点です。引用がしっかりしているため、アカデミックな文献検索においても使用することができます。
2022年に設立されたスタートアップ企業によって運営されており、まさに大規模言語モデルによるAIが盛んになった時期から始まったツールと言えます。
公式ページのQ&Aにあるように、このツールは検索エンジンの代替となるものを目指しているようです。そのため、アカデミックな文献検索のみではなく、YouTubeなどの動画検索や画像検索など一般的な検索機能にも精通しています。大規模言語モデルによるAI+ウェブ検索を強力に使っているのが特徴的です。
英語版Wikipediaをみると、ウェブクローリングをして情報をかなり集めているようですが、Forbesなど有名雑誌の盗用になるのではないかと批判もあるようです。1
なお、ここで使われるAIは無料版の場合、独自のモデルとなっていますが、有料版ではChatGPT, Claude, Opusなどのメジャーな大規模言語モデルをそれぞれ使用できるようです。月額$20で課金すると無制限に使用できますので、複数のモデルを検索のために使う場合はこちらで一本化したほうが安くつきます。
では続いて、文献検索で使用する際の使い方を見ていきたいと思います。
基本的な使い方
公式ページにアクセスすると、アカウントなしでも簡単に利用ができます。
使い方はとても簡単で、ホーム画面に出てくるフォームに、聞きたい質問を入れるだけ。
プロンプトと呼ばれる文章の形でも良いですし、キーワードの形でも結構意図をくみ取って検索してくれます。
簡潔な回答を出すというコンセプトに沿っているのか、画面もとてもシンプルで見やすいです。
なお、アカウント作成をすると1日5回までのproサーチ(上述の有料版のサーチと一緒でChatGPTやClaude等のモデルが使用可能)ができたり、過去の検索履歴の確認と整理ができます。簡単にアカウントは作れるので、とりあえず作成してみてもよいかもしれません。
フォーカス機能
検索の際にはフォーカスと呼ばれる検索の内容を絞り込む機能が使えます。現在フォーカスできるのは以下の6つです。
- All 全ての内容についてインターネットで検索
- Academic 出版されたアカデミックな文献から検索
- Writing ウェブ検索はせずに、テキストやチャットを生成
- Wolfram|alpha 計算やコードに特化した機能
- Video Youtubeからの動画を検索
- Social アメリカでメジャーな掲示板サイトから意見を検索
※Socialはつい最近までReddit(アメリカの掲示板サイト)だったのですが、変わったようです。今後また機能も変わってくるのかもしれません。
なお、Allを選んで検索しても専門的な内容であれば文献を引用してくれることが多いのと、プロンプトが複雑であったり、ニッチな領域の検索をAcademicで行うと、ソースを示してくれなくなるときがあったので、文献検索の場合であっても、必ずしもAcademicでなくても良いかもしれません。
また、キーワードのような形で調べたいデータベースを入れることである程度それに合わせてくれます。
例えば"<質問内容> pubmed"という風に入れれば、pubmedから引用をとるようにしてくれます。他にもNEJM, BMJ, Lancetなどメジャーなジャーナルであればできるだけそこから引用してくれようとします。
検索機能としてこういった簡便な方法で絞り込めるのはとても便利です。
検索結果の見方
検索を行うと以下のような画面で回答が生成されます。
上部にSources(参考サイトや文献)の情報が並びます。これらはクリックすることで直接文献に飛ぶことができます。
また、回答下部にある...という部分をクリックすることでSourcesのタイトル全体と本文の一部を見ることができるのと、チェックボックスをクリックすることで指定した参考文献やサイトを取り除くこともできます。そうすると回答の内容も少し変わります。
またrewrite機能を押すとproサーチへの切換えが可能です。その際は使う言語モデルを選択することができます。無料版でも1日5回までは利用できるので、試しに使ってみても良いでしょう。
対応する言語と注意
検索する際は英語と日本語どちらも使用できますが、あくまで検索エンジンの代替を目指すツールですので、それぞれの言語に応じて結果が変わることには注意が必要です。
以前紹介したScispaceは検索する文献が基本的に英語なので日本語で入力した場合も
日本語で入力>英語に変換>検索>英語の出力>日本語に変換出力
という流れでしたが、Perplexityでは言語に応じた検索をそのまま行うため
その言語に基づいたソースが多く表示されます。
そのためそれぞれの言語で通常のウェブ検索をした場合と同じ感覚で言語を使い分ける必要がありそうです。
質問を追加する
質問した内容についてさらに深掘りしたい場合は、回答の画面下部にあるAsk follow-up(下図赤矢印)から入力します。
また、質問されやすそうな内容についてはあらかじめ質問一覧が表示されているので、そちらから選ぶことも可能です。
このfollow upでは最初に聞いた内容に回答が引っ張られるので、全く違う内容について質問したい場合は改めてスレッドを立てる方が良いでしょう。
Proサーチを使う
また、検索についてはフォームの右下にある"pro"と書いてあるスイッチをクリックすることでproサーチを行うことができます。
proサーチではステップを踏んで疑問への回答を深掘りすることでより詳細な回答を得ることができます。
例えばある専門用語について聞いた場合
- 専門用語の概要と定義
- 専門用語の使い方
- その応用方法 など、複数の手順を自動的に生成し、それぞれを調べて内容をまとめてくれるようになります。
コレクション機能/過去の履歴をまとめる
過去に行った質問はサイドバーにありますlibraryから見ることができます(下図赤矢印)。
それぞれの質問とその後のfollow-upが含められたスレッドが表示されます。
同じような内容をまとめておきたい場合は右側にありますコレクション機能を使ってスレッドを一つにまとめておくことができます。
コレクション機能ではそこに含まれるすべてのスレッドに指定をかけるようなAI promptもついていますので コレクション内で一定のジャンルの内容をどんどん深めたいときには役立ちます。
実際の使用例とScispaceのLiterature reviewとの比較・考察
以前Scispaceの文献検索機能を使って、臨床的な疑問についての回答を検討した記事を書きました。
今回perplexityでも同様に回答をみてみるとScispaceとは回答の傾向や内容がまるで全然違うことに驚かされました。
例えば「ヘパリンは脳梗塞急性期に有効か?」という質問を英語で投げかけてみます(Is heparin effective for the treatment of acute ischemic stroke?)。
すると出てくる内容はほとんどがnarrative reviewなどのエキスパートの意見でした。
reviewは多くの場合、専門家が過去の研究を総括してまとめていますので、内容としては(その専門家に大きく偏りがなければ)かなり現実的な意見が多いです。
そのため導き出された回答をみると、確かにその通りだと納得できる部分が多く見受けられました。
回答の内容がScispaceの場合と大きく異なるのはデータの対象と指向によるところが大きいのだと思います。
Scispaceは一次情報と呼ばれる論文の中でも一番のおおもとになる情報が多く対象になるのに対して、PerplexityはWeb上全体の文献から簡潔にまとめられた情報を探していくため、レビューやSemantic Scholarなどのまとめられた内容が対象となるのでしょう。
※Semantic Scholarとは 機械学習を用いて通常のキーワード検索以上に文献のつながりをうまく抽出し、表示する文献検索ツールです。2024年現在2億以上の文献をストックしており、文献検索以外にもTL;DR(Too long; don't readの略で要するに短い要約)を自動生成する機能も持っています。
その業界における大枠ともいえる内容を知るにはこちらの方がかなり優れているかもしれません。
ただその一方で、一次情報である元の研究論文には直接たどり着けないことは注意が必要です。
引用されているレビューが偏りがある可能性は否定できませんし、特にSemantic scholarが多く見受けられますが、機械学習して要約したものをさらに要約していることになるので、そうなるともはや正当性はSemantic Scholarに依存してしまいます。
あたり前な結論かもしれませんが、正確性を重視するときであれば一次情報まで必ず当たる事が必要です。
なお、それぞれの根拠となるエビデンス、研究、一次情報を出してください、とfollow-upで入力すると結構それも出してくれます。
もちろん本当にそれらが引用された根拠になっているのかは個々のレビューを読まないと分からないのですが、この質問で出てくる一次情報は重要な研究を確かに含んでおり、これもまた時間を節約してざっと検索する時には役立ちそうです。
料金
最後に大事な料金体系ですが、月$20でproアカウントにすることができます。 proアカウントではPDFなどのファイルのアップロードが無制限になる他、pro searchの制限回数が300回以上となるようです2。
まとめ
文献検索をする際のPerplexityの基本的な使い方、考察について述べてきました。
Perplexityは簡潔に検索を行うためのツールで前回紹介したScispaceとは方向性が大きく異なるものです。しかしながら要約情報をWebからうまく検索して抽出することで、むしろ専門家の視点に近いものを得られる可能性が十分ありそうです。
欠点としては一回の検索で得られるソースの量はあまり多くないので、幅広く情報が欲しい場合には適さないところがあります。また、時折引用したサイトや文献をみてもその内容が書いていないこともありました。preplexityの利点のひとつは引用先をきちんと提示することで内容の真偽を人間が確認をできる点だと思いますので、チェックは欠かさないようにしておきたいです。
また、このツールは学術文献に限らず一般的な検索機能としてかなり使えます。特に動画や画像の提示もまとめてできるので、学術的に難しい概念や数式などを調べる際には理解の一助になることも多々あります。文献のみならずこれらの機能もぜひ活用してほしいところです。
今後も文献検索に役立つツールをさらに紹介していきたいと思いますのでよろしくお願いします。
コメント