*日本大学生産工学部マネジメント工学科教授**株式会社ツムラ 漢方研究開発本部 ツムラ先端技術研究所─ 11 ─日本大学生産工学部研究報告A2023年 6 月 第 56 巻 第 1 号Keywords: Near infrared spectroscopy, Pattern recognition, SN ratio, Quality engineering, Mahalanobis distance研究ノート1.序論Koya YANO*, Yoshikazu MORI** and Naoki OIKAWA**えば10,000項目もあるような高次データの場合,その逆行列を解くには変数より多い数万のデータが最低限必要となるし,その時々で次数に見合うデータが揃っているとも限らないことから,高次元データや標本数が少ないデータに対する何らかのアプローチが必要である。よって多数の項目の取り扱いにおいて,効率的かつ正確に特徴を読み取る工夫が必要であるが,多数の項目から次元を削減する方法や,項目数以上のサンプル数準備のためのデータのシミュレートなど,多変量データの分析における制約を越えて精度よい分析を行うべく方法が検討されている。ところで品質工学は効率化や低コスト化を謳っており,その中のいくつかの手法においてデータ解析を簡便化しており,その代表的な尺度がSN比という指標で,統計でいえば標準偏差に代表されるばらつきと,希望する測定データの平均的な効果といった2つの異なる尺度を1指標にまとめて同時評価が行えるという性質を利用している。このSN比を多変量データの分析に利用しているのが,提唱者名に由来する「認識のためのタグチ法」といわれるT(Taguchi)法(3)またはRT(Recognition 矢野耕也*,森 芳和**,及川直毅**A method of Quality Control in Pharmaceuticals Using Near Infrared Spectroscopy (NIRS)品質管理が産業界に適用され70年以上が経つが,品質不良が根絶されたとはいえない。品質管理はあらゆる製品に対して適用されるプロセスであるが,それゆえ対象の幅やデータの種類もさまざまである。そのため,合格不合格のような目視等による単純識別から,複雑なデータで判断する必要があるケースなど多岐に渡るが,過誤がないように見極めることが重要で,そのため検査方法やチェックの指標は確実性が高く明確であることが望ましい。ところでいわゆるデータサイエンスといわれているものは,数学や統計学,情報工学,機械学習等を用いて大量のデータの分析を行い,その中から何らかの有用な知見を得るもので,基礎部分はいわゆる多変量解析と呼ばれる分野と重なることもあり,それらを利用して分類や識別,予測などを行うことも多い。その場合,取り扱うデータが大規模となるケースも少なくなく,変数(項目,以降項目と呼称)が多いことが普通となり,古典的な多変量解析ではそのままの対応に限界が生じるケースもある。たと近赤外分析法(NIRS)を用いた医薬品における 品質管理の一手法
元のページ ../index.html#13