日本語の「氏名」「生年月日」「性別」「住所」基本4情報とコンピューターの自動処理との悪い相性

豆知識?のメモ

なんかマイナンバー制度を捨ててしまえば、余計な問題は起きないのではないか?
というのが読後の感想

・・・そういえば、すっかり悪評が立ってる京都市の基幹系システムのリニューアル、結局どうするんだろう?

日本における「名寄せ」と「照合」の黒歴史【日経XTECH:浅川直輝 2023年7月20日】

 健康保険証、銀行口座、年金記録――個人のマイナンバーに別人の情報がひも付けられるトラブルが後を絶たない。多くの事案に共通するのは、自治体や関係機関の職員が氏名や生年月日などを基にマイナンバーや住民データを照会した際に、誤って同姓同名の人の情報を引き出してひも付けてしまうというケースだ。

 こうした情報のひも付けをする際、職員が住民データの照合や突合、本人確認に使うのが「氏名」「生年月日」「性別」「住所」、いわゆる基本4情報といわれるものだ。

 だがこの4情報は、コンピューターによる自動処理とは絶望的に相性が悪い。例えば氏名は「邊」「邉」など旧字・異体字の揺らぎや外字の処理が煩雑なうえ、婚姻による改名もある。よくある氏名の場合、氏名も生年月日も同一というケースが頻発する。住所は時期によって変わるうえ、人によって書き方が「一丁目四番」から「1―4」まで一意ではない。

 こうした曖昧な識別符号を代替するのがマイナンバーの本来の役割だが、そもそも現段階では銀行口座の開設など多くの事務で、国民によるマイナンバーの記入・登録は義務化されていない。このため自治体も民間企業も基本4情報だけで照合せざるを得ず、それが別人との取り違えを発生させるという、本末転倒な事態が起こっている。

「宙に浮いた年金」から状況変わらず

 基本4情報に頼った照合・突合・名寄せ。この作業はこれまで幾度も役所などにおける手続きミスの要因となり、ときに深刻な事態に発展した。その最たるケースが、2007年に発覚した「宙に浮いた年金」問題だ。今につながる教訓を含むこの問題を改めて振り返ろう。

 1997(平成9)年、年金を管理する社会保険庁(当時)は複数の年金番号体系を「基礎年金番号」に統合するため、「氏名」「生年月日」「性別」に基づいて年金納付記録の名寄せをした。だが約3億件の記録のうち、10年たっても約5000万件の記録を特定できなかった。

 総務省が2007年に公開した「年金記録問題検証委員会報告」によれば、特にずさんなデータ管理がみられたのが厚生年金保険の記録だ。

 1979(昭和54)年、社会保険庁は厚生年金保険の記録をコンピューター処理に対応させるため、氏名の記録方式を従来の漢字コードからカナ文字に切り替えた。その際、フリガナを本人に確認する方法がない被保険者については「数値符号化した漢字氏名をカナ氏名に自動変換して収録した」という。「これら漢字カナ自動変換したカナ文字氏名の一部については、本人確認のないまま(中略)そのまま記録され、未統合の『5000万件』の記録の一部として残っている可能性がある」(年金記録問題検証委員会結果報告書p154)。

 コンピューター処理をしやすくするためにカナ文字を導入したのに、本人の確認のないまま漢字をカナ文字に変換し、かえって記録を宙に浮かせる結果になったというわけだ。

民間企業にとって名寄せは「費用対効果が悪い」

 戸籍や住民基本台帳に記録され本人確認に使われる「氏名」には一般に漢字が使われるが、その表記や読み方には揺らぎがある……。こうした問題は、民間企業にとっても長年にわたり悩みの種になっていた。

 民間企業の場合、取引先・営業先の法人名について名寄せすることはあるが、個人顧客の名寄せについては積極的に行わないことが多いという。事務負担が重く「費用対効果が悪すぎるからだ」と、データマネジメント支援を手掛けるD.Forceの川上明久社長は語る。

 氏名については、一般に文字数が3~5文字と少ない(つまり同姓同名が多い)ことに加え、前述した旧字・異体字・外字の問題があることから、名寄せ処理の要素として使いづらい。「顧客データ管理における名寄せの要素として『氏名』が使いづらいというのは世界でも珍しく、日本特有の現象ではないか」(川上社長)。

*住所情報を使った照合については、以前と比べて環境が改善されているという。「民間企業の場合、(経済産業省が2020年に公開した)『住所変換コンポーネント』ツールを使って正規化しているケースが多い。使い勝手は良く、大半のケースで正しく変換できる」(川上社長)。ただし住所は転居によって容易に変わるため、名寄せの手段として使いやすいとは言いづらい。

 ではフリガナは使えるかというと、こちらも用途によっては使いづらい。氏名からフリガナを一意に特定できず、また運転免許証などの本人確認書類からも確認できないからだ。2023年6月に改正戸籍法が成立し、2024年以降に戸籍へのフリガナの登録が義務付けられるが、「1年以内に届けがなければ職権で記載する」といった運用になる見込みで、フリガナの揺らぎをめぐる混乱は当面続きそうだ。

 年金記録と同様、フリガナの揺らぎが悪い影響をもたらしたケースとして、クレジットやローンの履歴といった信用情報データベースがある。こうしたデータベースは一般に「フリガナ」と「生年月日」を基にデータを管理している。

 金融マンガの名作「ナニワ金融道」には、街金(まちきん)業者に金を借りに来た客に対し、漢字の氏名からあり得る複数のフリガナを信用機関に照会し、借金の履歴を見破るといった場面がある。現在の実務では本人を確実に特定するため電話番号や運転免許証番号も活用しているが、フリガナと生年月日を基に信用情報を検索している点は今も昔も変わらない。

 こうした名寄せ・照合・突合の困難さは、現代のビッグデータ活用にも影を落としている。マーケティング用途などに向けた顧客データ管理サービスを提供するトレジャーデータの三浦喬社長執行役員は「氏名・フリガナ・住所は、名寄せや突合には使えないデータと判断している」と語る。

 代わりに同社が活用するのが、メールアドレスと携帯電話番号である。例えばヤフーが同社と連携して2023年4月に提供を始めたデータクリーンルームサービス「Yahoo! Data Xross」で、トレジャーデータが管理する企業の顧客データとヤフーのデータを突合させるのに使っているのが、メールアドレスと携帯電話番号である。いずれも、個人が数年~数十年にわたって保有すること、入力ミスの検証が(メアド認証やSMS認証などで)容易であることから、名寄せの手段としても多くの企業が活用している。

 一方、こうしたマーケティング用途の名寄せ・照合とは発想が根本から異なるのが、個人の資産に関わる名寄せ・照合である。誤りの確率が少しでもあれば、本人への確認というプロセスが必要になる。例えば金融機関の場合、登録された住所へはがきを郵送して情報の確認を促し、はがきに記載した秘密の番号で本人認証のエビデンス(根拠)とする。「マイナンバーへのデータひも付けについても、そうした本人による確認のプロセスを設けた方がよいのではないか」とD.Forceの川上社長は語る。

なぜ住民情報のデータガバナンスは失われたのか

 マイナンバー制度に基づく情報連係が始まる以前、政府や自治体の行政システムにおいて「行政事務」と「住民データ」は良くも悪くも密結合していた。日本の住民データ管理の歴史をひもとくと、それが行政の事務と密接に結びついていたのが分かる。

 例えば、今の住民登録制度の基になったのは、太平洋戦争中の配給制度を円滑に運営するため町会ごとにつくられた住民台帳だった。戦後、住民台帳の管理は地方自治体に移行し、選挙、教育、課税といった多様な事務に使われるようになった。

 戦前までは、自治体ではなく司法省(現法務省)が、戸籍とセットで国民の居住情報(寄留簿)を管理していた。だが住民に関わる事務の多くは地方自治体が担っており、戦後に住民データ管理の主体が個々の自治体に移ったのは自然の成り行きといえた。

 その一方、データの仕様を統一し品質を維持する「データガバナンス」という観点では、混乱の種を残した。数千の自治体が独自の事務フローに基づき独自の住民データ仕様を定義・運用した結果、自治体をまたいだ情報連係が極めてやりにくくなった。

 この結果、住民基本台帳ネットワークシステムから情報提供ネットワークシステムまで、行政機関をつなぐ情報連係の新たな枠組みが登場するたびに、データガバナンスの問題が障壁となって立ち塞がった。

 「本来であれば、行政機関の間で住民データを連係させ再利用する段階で、全体のデータガバナンスを見直す必要があった」と、デジタル庁の楠正憲統括官は語る。「マイナンバーがあればこうした問題を一気に解決できる、というわけではない。戸籍の読み仮名表記に加え、パスポートのアルファベット表記、外国人の氏名データの表記など、データガバナンス上の課題を1つひとつ解決していく必要がある」(楠統括官)。

 政府はマイナンバーに関する手続きの総点検を2023年秋までをメドに完了させる考えだ。まずは⾃治体など関係機関に対し、データひも付けに関わるマニュアルに不備がないかを点検させる。ただデータ品質向上の観点からは、デジタル庁がデータ照合事務の標準プロセスを自治体に示すとともに、データ誤り率を見える化するなどして品質をチェックする必要がありそうだ。

 データガバナンスをめぐる地道な作業は総点検の後も続く。自治体情報システムの標準化から、マイナンバー記入を義務付ける事務の拡大、氏名の文字コード統一、氏名の読み仮名の確定と、国民への説明と理解を前提に、一歩一歩進めていく必要がある。