Methodology

Aincarn Lab の比較方法

Aincarn Lab は、最新AIに同じ条件でタスクを実行させ、出力を一定の評価軸で記録する独立系の比較ログです。広告やスポンサーの有無が評価結果に影響しないことを原則とし、検証の手順・データの種類・限界をすべて公開します。

Independence

独立性について

Process

Evaluation Axes

用途ごとに、あらかじめ決めた評価軸で採点します。

構成の明確さ日本語の自然さ初心者への説明力注意点の拾い方記事化しやすさ

完成物の動作UIの使いやすさコード品質要件の満たし方修正しやすさ

論点の網羅性根拠の扱い不確実性の明示要約の読みやすさ次に取る行動の明確さ

Data Sources

Aincarn Lab（自社実測）

このページと各比較ログは、Aincarn 自身が同一プロンプトで実行し採点したオリジナルの記録です。

AIモデル比較ツール（第三者データ）

「AIモデル比較」ツールの性能スコアは、Artificial Analysis などの公開ベンチマークを出典として表示しています。Aincarn Lab の実測とは区別しています。

Limitations

サンプル数は限られ、定性的な判断を含みます。順位は「その条件での傾向」であり、唯一の正解ではありません。

モデルは頻繁に更新されます。結果は実施時点のもので、変わります。だからこそ毎月追記して蓄積します。

用途・プロンプト・好みによって最適は変化します。最終判断は各自の用途で確認してください。

出力の全文転載は最小限にとどめ、傾向と要点の記録に絞ります。

検証結果は毎月追記し、同じページに蓄積していきます。