※本情報は解説作成時点のもので、閲覧時点では法改正等により情報が変更になっている場合がございます。あらかじめご理解いただければ幸いです。
正解は「B.a.b.c.d」です。
AIの機械学習では、学習データの質や偏りが結果に大きく影響します。目的に適したデータの選定、入手元や来歴の確認、適切なアノテーション付与、品質の低いデータの除外はいずれもバイアス低減や品質確保のために有効な対策です。
この記事では、ITパスポート試験(令和7年度)で出題された過去問の第8問「AI学習データの品質管理」について、試験対策の観点からわかりやすく解説します。
学習データ品質の重要性
AIの精度=アルゴリズムの性能 × データの質
機械学習では、偏ったデータや誤ったラベル付けがあると、出力結果にも偏りや誤りが生じます。そのため、データの選定・管理が極めて重要です。
各選択肢の確認
- a:目的に適したデータの確認は基本的な品質管理
- b:入手元や作成来歴の確認は信頼性確保につながる
- c:学習目的に合ったアノテーションは精度向上に不可欠
- d:人間でも識別困難なデータを除外することはノイズ低減に有効
以上より、a~dの全てが適切な対策です。
問われているポイント
この問題では、「データ品質確保の観点」を理解しているかが問われています。
アルゴリズムだけでなく、データ管理の重要性を押さえることがポイントです。
気を付けてほしい点(勘違いしやすいポイント)
- AIの精度はデータの質に大きく依存する
- アノテーションの質も結果に直結する
補足
近年のITパスポートでは、AI活用に伴うリスクや品質管理の観点が頻出です。技術面だけでなくデータ管理の視点も重要です。
ITパスポート試験での出題パターン
ストラテジ系では、AIやデータ活用に関するガバナンスや品質管理の問題が増えています。
データの信頼性・公平性の確保は重要テーマです。
この知識が使われている問題
まとめ
- 学習目的に適したデータ選定が重要
- 来歴確認・適切なアノテーション・ノイズ除外が品質向上につながる