大規模言語モデルを用いたサンプルメタデータの自動キュレーション @ データ解析講習会:AJACS「生命科学分野におけるナレッジグラフとオントロジーを知って・学んで・使う」
Aug 1, 2025•Channel
AI Analysis
Data from YouTube Data API v3•Updated Just now
Video Overview
Video Details
Published10 months ago
Duration28:02
Video IDcbRetXxXXgQ
Languageja
CategoryScience & Technology
PrivacyPublic
Made for KidsNo
Video TypeRegular Video
Performance Metrics
Views66
Likes1
Comments0
Engagement Rate1.52%
Likes per 100 views1.52
Comments per 1K views0.00
Description
https://doi.org/10.7875/togotv.2025.044
--
本日の統合TVは、2025年6月26日に開催された データ解析講習会:AJACS「生命科学分野におけるナレッジグラフとオントロジーを知って・学んで・使う」から、ライフサイエンス統合データベースセンター 池田 秀也 による「大規模言語モデルを用いたサンプルメタデータの自動キュレーション」(講習スライド https://biosciencedbc.jp/event/files/AJACS-2025-06-26-06-Ikeda.pdf、Q&A https://biosciencedbc.jp/event/files/AJACS-2026-06-26-KG-and-Ontology-QA.pdf)をお送りします。
大規模言語モデル(LLM)によって自然言語からの高精度なエンティティ抽出が可能になりました。本講演では、モデルの追加学習なしで実装した我々のツールとその精度評価について解説します。DNA シーケンス試料の自由記述メタデータを自動で整理・補完することで、研究現場のデータ整備コスト削減と再利用性向上を目指しています。
00:20 概要
01:21 背景: 公共データリポジトリによる実験データ共有の恩恵
02:30 背景: BioSampleデータベース
03:16 課題: サンプル情報の不備がデータの再利用性を下げている
4:24 課題の具体例
5:30 課題の解決策: オントロジーの利用(沈黙の数秒を少しカット)
06:33 既存研究: MetaSRA
08:05 既存研究の課題
10:06 研究目的: LLMを活用したサンプル情報の品質の改善
11:35 手法: LLM実行環境
14:52 結果: 細胞株名抽出とオントロジーマッピングの評価のための正解セット作成
17:54 LLMによる細胞株名抽出・選択
19:48 正解セットを用いた性能評価
20:27 誤答パターン
21:21 応用例: 遺伝子名の抽出
23:35 LLMによる遺伝名抽出: 結果
25:42 まとめ・展望
--
#togotv#DBCLS#bioinformatics