1: ライトスタッフ◎φ ★:2014/02/20(木) 13:36:23.33
厚生労働省が研究目的で構築した「ナショナルデータベース(NDB)」で、 約1600万人分のメタボ健診のデータが、レセプトのデータとひも付けできないことが判明。当初想定した医療費削減のための研究に、十分に生かせない状況に 陥っている。

理由はデータ入力時に「全角」と「半角」が混在していたことだ。

厚労省は2014年3月までにシステム改修を含めた改善策をまとめる。

http://itpro.nikkeibp.co.jp/article/NCD/20140212/536175/
2: 名刺は切らしておりまして:2014/02/20(木) 13:37:21.01 ID:ei8ASgEQ
フィルター一個かませばいいのに 

改修費30億円
214: 名刺は切らしておりまして:2014/02/20(木) 19:29:54.30 ID:wK8xXwSI
>>2
こんな簡単な事で30億円
ぼろ儲けだわ
72: 名刺は切らしておりまして:2014/02/20(木) 14:10:07.85 ID:5ngKrRoQ
>>1-2
予算おかわりするために仕込んだ可能性もある


108: 名刺は切らしておりまして:2014/02/20(木) 15:11:38.56 ID:1S7wTncF
>>72 に一票!!
6: 名刺は切らしておりまして:2014/02/20(木) 13:40:07.87 ID:DdIIH0IO
英数字や記号を全角入力する奴は許せない
11: 名刺は切らしておりまして:2014/02/20(木) 13:42:47.97 ID:N2NVhoqJ
>>6
1バイト(半角)カタカナを使う奴は?
63: 名刺は切らしておりまして:2014/02/20(木) 14:06:27.12 ID:r3pp05P0
>>6
全角を強制するサイトもあるんだが
207: 名刺は切らしておりまして:2014/02/20(木) 19:22:18.44 ID:hBpxsb5M
>>6
切り替えるのが面倒くさい。
8: 名刺は切らしておりまして:2014/02/20(木) 13:40:58.64 ID:Fjgj0JlT
それだけならそんなに難しく無いだろう
全角・半角ならどちらかのデータをどちらかにあわせる処理をすればよい
と 言うか設計時に分ってる事だろう?
10: 名刺は切らしておりまして:2014/02/20(木) 13:42:31.90 ID:qcXyToP3
俺一応この道のプロだが
年寄りとか素人はやたら数字でも全角使いたがる
というか区別出来てない
26: 名刺は切らしておりまして:2014/02/20(木) 13:49:07.00 ID:3pP/Xy44
>>10
さまざまな入力フォームでなぜか全角で入れろ!と強制されるんだが。
なんなんだ?
住所の番地は全角で!
電話番号は半角で!

うざーーーー
34: 名刺は切らしておりまして:2014/02/20(木) 13:53:19.56 ID:AxYAHOQ1
>>26
住所の番地を半角で入れたらエラー
次の電話番号を全角で入れたらエラー
アホかと
66: 名刺は切らしておりまして:2014/02/20(木) 14:07:36.26 ID:iXSc3/8z
>>26
そうだよな
全く問題ないとこもあるんだし、改善できるだろ
165: 名刺は切らしておりまして:2014/02/20(木) 16:16:37.77 ID:A44lz3ko
>>26
あるあるあるあるあるあるあるあr
54: 名刺は切らしておりまして:2014/02/20(木) 14:02:30.51 ID:e0VaT36J
>>26
住所などを全角で強制するのは、例えば郵便物に住所などを印字するときには、
印字枠内に収める必要があるが、全角半角が混在していると印字後のサイズを
計算するのがタイヘンだからとか、名寄せ処理に手間がかかるとかだな。
全部半角で入力するのは無理だから、必然的に全部全角を要求することになる。

これとは、関係ないはなしだが、MS-Wordの標準設定だと、英数の半角文字と
全角文字の文字間が無駄に空くのがウザいな。
あの設定がうれしい人がいるのか?
123: 名刺は切らしておりまして:2014/02/20(木) 15:27:34.94 ID:nHAXLals
>>54
数字を全角にしたせいで二桁以上の数字が途中で折り返されて可読性を損なうとかザラなのに
住所に二行しか使えないのに、全角数字が意図しないところで折り返されて本来の二行目が印字できてないとか

全角強制にするならするで、そういう部分も考慮して欲しいわ
13: 名刺は切らしておりまして:2014/02/20(木) 13:44:15.81 ID:v0tKPftt
全く違うシステムを名前をキーにしてくっつけようとしてんの?
14: 名刺は切らしておりまして:2014/02/20(木) 13:44:27.77 ID:X/jrcKdL
どっちかに統一させるようにプログラムを通過させれば良いのでは
とプログラムできない俺が解決策を提案
15: 名刺は切らしておりまして:2014/02/20(木) 13:45:18.79 ID:eXrnO3ei
数値と文字の区別を素人に期待しては
でも素人向けのエクセルは全角の1どうしを足しても半角の2にしてくれる
16: 名刺は切らしておりまして:2014/02/20(木) 13:45:39.45 ID:gVL6a0wl
厚生労働省またか??
消えた年金5千万人分はどうした??
半分は未解明とか!!
19: 名刺は切らしておりまして:2014/02/20(木) 13:46:12.22 ID:GadEtI3o
この手のニュースって一般人の興味はどこのメーカー(代表)&業者(現場)に任せたんだって事なのに何で報道されないんだろ
27: 名刺は切らしておりまして:2014/02/20(木) 13:50:20.95 ID:RBRyCjGU
>>19
IBMや富士通はさすがにこのレベルはやらかさんだろ、仮に孫請だったとしてもだ(笑)
俺は大塚商会の仕業と見た
128: 名刺は切らしておりまして:2014/02/20(木) 15:31:09.08 ID:SG48Fv/1
>>27
大塚商会の下請けで仕事をしたことがあるがw
こんなアフォなことはやらんぞ
31: ライトスタッフ◎φ ★:2014/02/20(木) 13:52:09.96
>>27
F通さんだそうです
42: 名刺は切らしておりまして:2014/02/20(木) 13:55:54.11 ID:RBRyCjGU
>>31
wwwwwwwwwwwwwwwwww
あ、正確な情報どうも。
思わずFと聞いて失笑してしまいましたw
36: 名刺は切らしておりまして:2014/02/20(木) 13:53:27.99 ID:H/XhYzfE
>>31
Fもレベルが落ちたもんだな
50: 名刺は切らしておりまして:2014/02/20(木) 14:00:52.06 ID:Fjgj0JlT
>>36
今の大手にこの辺を出切る企業は無いと思う
内部に開発部隊持ってなく子会社使って管理しているだけでは?
削減削減と言って基本部分まで外に投げているとしか最近は思えない
40: 名刺は切らしておりまして:2014/02/20(木) 13:55:15.53 ID:GadEtI3o
>>31
報道に受注メーカーと製造業者を明記すべきなのに最低でも食品業並みに
75: 名刺は切らしておりまして:2014/02/20(木) 14:11:26.34 ID:mfW8Gqr0
>>40
レセプト関係だからNTTデータ?
20: 名刺は切らしておりまして:2014/02/20(木) 13:46:19.97 ID:NOZLFErL
>>1
日本のIT技術レベルが下がってる証拠だな
21: 名刺は切らしておりまして:2014/02/20(木) 13:46:24.01 ID:ccbTekmt
>>1
全角半角だけの問題だったら、時間無視してだけど
シェルかDBファンクションで精査したらいいんじゃね?
出来ねえってメーカーが言うなら別のでかい問題が隠れてるんだろ。
22: 名刺は切らしておりまして:2014/02/20(木) 13:46:27.74 ID:J8B+AvBs
データが全角だろうと半角だろうとデータ型が同じならリレーションのリンクは張れるはず。
23: ライトスタッフ◎φ ★:2014/02/20(木) 13:47:41.64
この件をまとめたTogetterも貼っておきます。
興味のある方はご覧ください。

【日経コンピュータ誌が取り上げた
厚労省メタボ検診データベースシステムの不具合と改修をめぐって】
http://togetter.com/li/632157
24: 名刺は切らしておりまして:2014/02/20(木) 13:47:49.81 ID:e0VaT36J
全部全角に変換して突合すればいいだけだろ。
普通によくある方法論だがな。
ついでに、「ァ」「ュ」などの、ひらがな、カタカナの小さい文字を
大文字にそろえたり、長音があったりなかったりするから長音を排除して
比べたりする。
名寄せ処理の基本だね。
35: 名刺は切らしておりまして:2014/02/20(木) 13:53:24.32 ID:N2NVhoqJ
>>24
同姓同名で生年月日が同じ人をどうするかが問題。
住民登録なら本籍で確定できるけど、厚労省だから本籍は登録していない。
60: 名刺は切らしておりまして:2014/02/20(木) 14:05:46.27 ID:e0VaT36J
>>35
そのはなしが全角半角のはなしとどう関係するのか、頭の悪い俺には理解できません。
25: 名刺は切らしておりまして:2014/02/20(木) 13:48:35.10 ID:0mTbb/q9
厚生労働省はレセプト絡みでミスやらかしてるんだけど、多分隠蔽する
自分たちの責任を問われる事態になると逃げるからな
28: 名刺は切らしておりまして:2014/02/20(木) 13:50:52.64 ID:eXrnO3ei
まさか日本語が解らない所へ発注したとか
38: 名刺は切らしておりまして:2014/02/20(木) 13:53:34.70 ID:RBRyCjGU
>>28
そ、それだ!
もちろん日本語ができる『前提』で投げた親会社が居るのだろうが
32: 名刺は切らしておりまして:2014/02/20(木) 13:52:52.37 ID:SuqS3eFV
すでにテキストデータになってるなら
今日中に変換プログラム書きますよ

5億円ちょうだい
33: 名刺は切らしておりまして:2014/02/20(木) 13:53:01.08 ID:BVnemN5K
ネットの買い物とかで、住所が全角指定なのがわからん。
テンキー入力による誤入力防止なんだろうか・・・。

それはそれとして、全角と半角のせいで突合できないってのは意味不明だな・・・。
そんなに難しいことなん?
50: 名刺は切らしておりまして:2014/02/20(木) 14:00:52.06 ID:Fjgj0JlT
>>33
内部的にはコード比較だからね
大文字と小文字ではコードが違うから
ま 検索する時に事前に細工すればある程度防げるだろうけど
100%とは行かない
37: 名刺は切らしておりまして:2014/02/20(木) 13:53:34.76 ID:7rWBGkEK
お前ら自分の戸籍見に行った方がいいぞ
電子化して内容が変わってるで
231: 名刺は切らしておりまして:2014/02/20(木) 20:26:38.61 ID:5u/l5d7a
>>37
明治から続いていた手書きの戸籍は
市役所ごと津波で流され電子化された

アナログコピーのバックアップは手元にあるが
そもそも旧字体+縦書きで読めないw
41: 名刺は切らしておりまして:2014/02/20(木) 13:55:36.15 ID:gJmK2fdT
1回プリントアウトしてOCRで読み込ませればいいだろ。
50: 名刺は切らしておりまして:2014/02/20(木) 14:00:52.06 ID:Fjgj0JlT
>>41
OCRは精度良くなったとは言え、100%では無い
人の目でのチェックが入るならそれこそ大変
特に読めないだけならまだしも文字の誤認は探すの大変すぎる
79: 名刺は切らしておりまして:2014/02/20(木) 14:14:16.81 ID:jkFOMj4U
>>50
郵便物あるでしょ
あれ高速仕分け処理するために手書きの文字を処理してデータに変換
それを見えないインクで印字してる

やる気のあるところは実現してるんですよ
郵便物を人手で仕分けなんてしてられないではないか
94: 名刺は切らしておりまして:2014/02/20(木) 14:42:10.11 ID:Fjgj0JlT
>>79
郵便物は郵便番号が元だったはず
全部の文字ではなかったかと
それに読み取れなかった物は別の場所に出て来て
職員が手作業で分けてはず
それにあれの場合、最終配達でどの道人の目に止まるから
間違いがあればそこで分かる事になる
44: 名刺は切らしておりまして:2014/02/20(木) 13:57:00.89 ID:HixVMwX8
システム改善もなにも、全角・半角の両方の文字が入る可能性がある箇所について
ASCII文字なら一律半角に
JIS拡張の範囲は一律全角に
置換すればいいだろ、とは思う
45: 名刺は切らしておりまして:2014/02/20(木) 13:57:52.33 ID:113kMko2
データ変換して、登録時に全角に直すようにするだけでいいだろうに、
ニュースにするほどのことなのか?w
52: 名刺は切らしておりまして:2014/02/20(木) 14:01:47.51 ID:N2NVhoqJ
>>45
同姓同名で生年月日が同じ別人のデータを一人のデータとして扱ってしまう可能性がある。
56: 名刺は切らしておりまして:2014/02/20(木) 14:02:45.45 ID:HixVMwX8
>>52
それって一律全角、ないしは半角で入力されていた場合には起こりえない問題なの?
文字コードとは関係ないじゃん
70: 名刺は切らしておりまして:2014/02/20(木) 14:08:39.64 ID:N2NVhoqJ
>>56
住民登録関連なら本籍で確定できる。
でも厚労省のデータベースに本籍は登録されていないはず。

最初のシステム設計に問題があったのを誤魔化すために、全角、半角の問題にすりかえている。
77: 名刺は切らしておりまして:2014/02/20(木) 14:12:46.19 ID:HixVMwX8
>>70
いや、だからさ
突合のキーが足りないという問題なら突合キーを増やせばいいだけだろうて
「文字コードに相違があるなら統一すればいいじゃん」というレスしかしてない人間に対するレスでもないだろ
84: 名刺は切らしておりまして:2014/02/20(木) 14:19:51.04 ID:e0VaT36J
>>70
そのシステム内で入手できる情報を使ってシステムを構築するしかないわけで、
入手しえない情報が「あればよかった」なんて語っても無意味。
研究用のデータなんだから、最終的には同姓同名、同生年月日、同住所のような
レアデータは排除しても問題ない。
半角全角のはなしとはなんの関係もないし。
48: 名刺は切らしておりまして:2014/02/20(木) 14:00:06.75 ID:m21BZjY6
システム作る時にそのくらい想定しておけよw
49: 名刺は切らしておりまして:2014/02/20(木) 14:00:07.99 ID:7rWBGkEK
手入力で修正すればいいじゃん
どうせ暇してんだ公務員様は
53: 名刺は切らしておりまして:2014/02/20(木) 14:01:56.80 ID:XkZjxggR
全部半角にして比較したらええんでないのか?
55: 名刺は切らしておりまして:2014/02/20(木) 14:02:34.32 ID:OqCKTs42
こういうのって初めからの出来レースだよね
ずさんな仕様で発注して、発注側も開発側も誰一人突っ込まない
後から問題があったって追加の仕事が発生する
安価で効率の良い修正方法は選択しない
競争入札してても、持ち回りをあらかじめ決めてるんだろ!
59: 名刺は切らしておりまして:2014/02/20(木) 14:05:38.84 ID:la+oZjMk
既にキーをハッシュ化済みで、個人情報保護の観点から元データ削除済みとか?
昔は下請けがこっそり持ってた元データも、コンプライアンス遵守でしっかり消しましたとかw
61: 名刺は切らしておりまして:2014/02/20(木) 14:06:14.29 ID:xnDwK6Yv
一括変換すれば済む話だけど、簡単にできると金が廻らないからなぁ。腐ってるw
62: 名刺は切らしておりまして:2014/02/20(木) 14:06:15.74 ID:EC57fNuc
管理番号みたいなの付けてないの?
64: 名刺は切らしておりまして:2014/02/20(木) 14:06:48.10 ID:7rWBGkEK
単純に一人一人
番号ふれば良かったんだろ

バカみたい

例えば
376dhgの田中三郎さん
83: 名刺は切らしておりまして:2014/02/20(木) 14:18:38.32 ID:N2NVhoqJ
>>60>>62>>64
別々の診療機関が持ってるデータ(カルテ)から、同一の人のデータを突合して統計処理するのが、この研究。

個人情報保護に配慮しすぎたのが敗因。

もうすぐ国民総背番号制度が始まるから、このような失態は起こらない。そのかわり、国民総背番号で突合すれば、個人情報は丸裸。
85: 名刺は切らしておりまして:2014/02/20(木) 14:22:12.52 ID:HixVMwX8
>>83
少なくともデータ発生源及びレセプトデータの診療所情報を突合のキーにするだけで
1600万が紐付けできないという事態は是正できると思うが

診療所以外でレセプトを発生させない形で登録されたデータが紛れてたり
同一日に同じ診療所で同姓同名の同誕生日の人間が多数診療を受けたとかいうなら無理だろうが
87: 名刺は切らしておりまして:2014/02/20(木) 14:26:16.80 ID:e0VaT36J
>>83
半角全角と関係ない的外れな話を延々と書かなくていいよ。
収集した目的外に個人情報をつかったり、他の組織に渡したりしないというのは
基本中の基本なんだから、別に配慮しすぎた訳でもないなんでもない。
69: 名刺は切らしておりまして:2014/02/20(木) 14:08:11.08 ID:TyYOo3tV
「すみません、今日は切らしてまして。」

そうにこやかに謝りながら彼は僕の名刺を受け取る。
Fの営業が連れてくるSEはいつも名刺を持たない。
僕は彼の名刺をもらえたことは一度もない。
それでも僕は挨拶するたびに名刺を差し出すのだ。
いつになったら彼の名刺をもらえるようになるのだろう。
もしかしたらずっと僕の名刺が減り続けるだけなのだろうか。
そんな風なことを考えながら今日も彼のプレゼンを聞くのであった。
78: 名刺は切らしておりまして:2014/02/20(木) 14:13:18.05 ID:5NcE80jS
OCRは予想できない誤字が発生するのでさらに手間がかかる。
手書き原稿より始末が悪い。
80: 名刺は切らしておりまして:2014/02/20(木) 14:17:28.66 ID:iU/OVQp7
>>1
 半角と全角は変換可能。

 自分の健康保険証を見てご覧。
 漢字の名前はあっても、よみがなが書いていない。
 カルテ、診療報酬請求書にもよみがながない。

 に対して、特定健診はよみがなが基本。漢字は任意に入力。普通は
 健診者に失礼だから報告書用に入れるけれどね。

 病院の外来で、自分の名前を読み間違えられる人いるだろ?
 それはよみがなのデータが保険証に書いていないから。

 よみがなと漢字も名前は突合できない。これだけの話。
99: 名刺は切らしておりまして:2014/02/20(木) 14:53:00.52 ID:5nPQ3TAg
案外大変かもなあ
健診のデータの仕様が全部違ってたりして
メタボABCDEFの判定基準が時期、場所によってめちゃくちゃだったなんてオチも
102: 名刺は切らしておりまして:2014/02/20(木) 14:57:05.36 ID:mUP0S7Lp
元のデータを書き換えない前提だったんじゃないの?
元データの置換ができるから、簡単な話なんだし。

元のデータの所有権はそれぞれの病院にあるんだろうし
書き換えちゃうと、各病院の内部システムでうまく
動かなくなったりするだろうからな。
103: 名刺は切らしておりまして:2014/02/20(木) 15:02:39.10 ID:HixVMwX8
>>102
別に元データを書き換える必要はないし
突合時だけテンポラリに落とす際に変換噛ませばいいだけかと

加工する事によって本来の用途に支障が出そうな場合は大抵はそうすると思う
105: 名刺は切らしておりまして:2014/02/20(木) 15:06:15.30 ID:e0VaT36J
>>102
元データを置き換える必要などないだろ。
コンピュータ上での突合なんだから、突合するプログラムのメモリ上の変数値だけを置き換えるだけ。
126: 名刺は切らしておりまして:2014/02/20(木) 15:28:20.69 ID:t8ypbg95
>>1
「全角」と「半角」が混在自体、単純に修正プログラムを作成すれば
解決できる。
問題は「全角」と「半角」が混在している項目の文字最大桁数を変更する
必要がある点だと思う。
この点も容易に対応することはできる。

FのSEは当たり外れ多いから、外れの人が設計したのか?
それともFの下請け???
130: 名刺は切らしておりまして:2014/02/20(木) 15:32:31.68 ID:WHk3AMKj
社会保障番号というのか所謂「背番号」を導入すればこんな愚かなことはほぼ根絶するのに…
131: 名刺は切らしておりまして:2014/02/20(木) 15:34:39.93 ID:h6SLy1n8
フィルター一つで解決するんじゃないでしょうか?

解決できないような問題でしょうか?

それこそ全部のかなを文字コードに置き換えて拾っていっても

30億円はかからないだろうけど、一体何にそんなコストかかるんでしょうか?

だってかな全部あわせて99文字以下なのに。
それとも独自規格、CTRL+JIS 半角ひらがなでしょうかwwww
133: 名刺は切らしておりまして:2014/02/20(木) 15:35:13.38 ID:WHk3AMKj
データを半角か全角、どちらかに置換すれば良いと言っている人が多いけど、
実際にはそんな単純な問題じゃなくて、データ収集項目の不一致とか致命的なミスがあるんじゃないのか?
1001: 以下、名無しにかわりましてTAMESUREがお送りします:2111/11/11(為) 11:11:11.11 ID:tamesure
引用元:http://anago.2ch.net/test/read.cgi/bizplus/1392870983

Related Posts Plugin for WordPress, Blogger...