【悲報】北九州市長候補「住所の表記揺れを修正するプログラム?2時間で作れらぁ!」
■ このスレッドは過去ログ倉庫に格納されています
こんな脳みそスカスカでもそれなりの立場になれんやな こういうバカが安請け合いして現場が大荒れするんやろな 漢数字一律変換とかしたら千葉が1000葉になるやん 一般論やけど、イレギュラーが考えられてないシステムは無能やぞ
最近の政府が作るシステムが正にそれや >>3
落ちてるぞ
高専中退→ホームレス→実業家→2023.2.5北九州市長選落選。北九州の再興を目指す39歳無所属新人 >>1
よくわからない人「AI使う必要ないやん」
市長候補「Excel!Excel!Excel!」
市民候補「ワイ、またなんかやっちゃいました?」
住民DBをExcelで管理してると思ってるオッサンキツイよな😅 エクセルだと
「千代田一丁目」「1番1号」
「千代田1丁目」「1-1」
「千代田」「1丁目1−1」
「千代田」「1-1-1」
こんな感じでそもそもセルの区切るところすら違ってるんやぞ 一切文字打たせずシステムで決めた値を選ばせる形式以外揺れるわな どうでもええけど、住所入力するときに全角入力しか認めなくて
2を2にせんといかんかったり-をーにする必要あるのほんま嫌い エンジニアやけど正直これ引用してドヤ顔してるイキリエンジニアも大概きついわ 京都府が10000000000000000都府に変換されそう なんか日本の住所の正規化頑張ってる人たちいたよな
あのリポジトリのissue見るだけで大変なのがわかるわ ってはよ住所にナンバーつけろよ
千代田区1-1-1なら123456789みたいに番号振ればこんな問題解決やん 大文字の拡張子を小文字にしようとして全部ぶっ飛ばしたとこなかったけ? いくらお役所仕事でも流石に住所をExcelとかaccessで保管するのは不味そうやが えっ
漢数字とローマ数字とアラビア数字が混在する住所をEXCELで!? 地理情報系のエンジニアやがこの問題はマジで根深い
京都市のデータとかホンマ扱いたくない なんで郵便番号作った時に住所まで特定させなかったんや? ド素人なのにプロからの指摘を素直に受け取れないのは地方行政の長としてちゃんと役所回せてるのか心配になるな 日本の住所表記揺れは数多すぎ
正規表現プログラム5-10年規模でのプロジェクトなんやっけか Excelなら検索できるし楽勝じゃんとでも思ってそう 上司:2時間で作れるやろ
ワイ:こーこーこーでできません
上司:できない理由考えてる間に解決策考えろ
ワイ:金かかる案提示
上司:ダンマリ。やるともやらんとも言わずノーリアクション
この無駄働きよ >>36
町名表記だったり交差点の東入ル西入ルだったり表記揺れどころの違いちゃうもんなあ >>12
その「よく分からない人」って反ワクの商材屋やからな
市長候補がそこに乗っかってどう思われるか想像付かないのがひでーわ Excel最強だからな
9割の問題はExcelで解決する >>44
ちゃんとスレタイ読んでなかったわ
明らかに不適格やから落とすに限るな そもそも自治体の首長やりたいなら
住民基本台帳システム位調べてから投稿しろ こいつがほんとに2時間で作ったら国政選挙出た時票入れてやるよ Excelで仮に作ったとしてそのあとどう共有するつもりなんやろな なんGのエンジニアスレとかにもたまにこういう奴沸くよな
よく知らんなら黙ってればええのに 2時間じゃ1分で組み終わってもテストが終わらないと思う 名寄せクソめんどくさいから2時間ではとてもできんけどな うちの会社と同じ住所がちょっと離れたところにあるんやがああいうのなんで起きるんやろな ほらよ2時間でできたわじゃないとカッコ良くないことに気付けよな 丁番号の部分だけで考えても
数字のみ
数字と漢字の混在
漢字のみとかあるんやけど… AIの活用例として表記揺れを挙げるのがショボいってことかと思ったら最初からマイナンバーの話やん
そんで詰ってる本人も使ってもええゆうとるやん
元ツイの意図もようわからんわ 半角全角ぐらいならええけど
漢字も混ざると面倒くさそう >>16
A棟のAは全半角の違いがわかりやすいけどBは判別むずいわ 表記ゆれを治すってことはさ、正しい表記を定義する必要があるわけじゃん
表記の要件定義だけで数ヶ月かかりそう 作ったツールが正しいことを証明せなアカンのがまた面倒いんよな こういうのなくすための最善策はシステムで強制的に入力制限するしかないんよな
手書きとかマニュアルでやったものをシステムでチェックするのは限界があるしミスが起こりやすい 新潟市北区東栄町が2個あるってTwitterでみた 配送業者のシステム郵便番号入力しても反映されない時あるのもこのせい? 恐らくDBで管理されているものをExcelに落とし込み
正しいと定義された表記に統一
それを運用できるフォーマット(DB)に戻す
当然この間人力での変換工程はあってはならない
システムである以上テストもいる
二時間とか超人か? 未だに和暦すら廃止できない日本で住所の表記統一なんて無理やろ
頭の固い老害たちが猛反対するのが目に見える 1000-葉県 八日市 場 市
とかにしてくれるんやろ >>78
システム開発やったことない素人やから大目に見てあげてや >>79
和暦自体は構わんけど「元年度」表記と令和を5月から始めたのだけは許せん >>79
ほんま和暦とか古臭い住所の入力方式まるっと廃止してくれ
あと本籍と住所が違うケースも統一してや
あれマジでめんどい 逆転の発送で
地名に使われてる漢数字も全部アラビア数字にすればええんや
あと番とか丁とかは-に統一や
3重県とか-町とかにすれば置換も楽やろ 日本郵政が公開してる住所CSVデータがまず終わってるからなぁ
根深いんやでこれ マイナンバーカードにGPSの座標掛けばええんちゃう?
それで被りはなくなる 和暦とかいうゴミほんま早く消えろ
誰も得してないだろあれ 住所の正規化をExcelは草
エンジニア舐めんなよ >>86
それをまさにAPIで引っ張ってきて変換するプログラム作ったけどクソめんどくさかったわ >>88
プライバシーとかセキュリティの問題があるからアウト 和暦は別にあってもいいが、公的な書類は西暦に統一する必要がある 言うて日本の住所の正規化ここまでダルいとか知ってた?
ワイはこの話題でるまで知りもせんかったわ >>96
Webシステム開発携わったやつなら大体は直面する話だからSEなら知ってて当然ちゃ当然 >>97
よく分かんないけど住所の正規化が実現すればプライバシーとかセキュリティの問題が同様に出てくるんじゃないの? 役所勤めしてるけど、公文書で町名番地の表記を正確にしないといけないのアホらしすぎる
丁なのか丁目なのか、号がつくのかつかないのかとか絶対いらんやろ 清水氏は1983年福岡県北九州市出身、国立北九州工業高等専門学校電子制御工学科中退。
アルバイト、水商売を経て、地元の知人が経営する会社の統括責任者、飲食店コンサルタントを経て、2018年に独立。
現在はコミュニティカフェ、会員制クラブ、レンタルカラオケルーム経営、デザイン事業部を運営しています。
経歴が胡散臭いな 市長候補のやり方だと北9州市とかになりそうやが
まあ政治家はこのレベルのExcel知ってるくらいでええやろ 色んなサイトで会員登録するときの住所入力方式の多様さだけでも難しいのわかるやろ アパート名とかのハイフン巻き込んで大惨事になる未来しか見えない まぁそもそもこんなん絶対発生する話なんやから今更やけどな まずDB処理が普及してから何十年経つと思ってるのかよな
誰しもがめんどくさいと思ってる作業がなくならないのは障害が大きいからよ >>107
確かにいつぞやのデジタル担当大臣よりは知ってそう
でもこれでドヤ顔されるくらいならなんも知らんほうがマシなんやろか… 市長候補ってなんだよ
ついこの前選挙あったんやから元市長候補やろ >>102
論点がずれてる
そもそも位置情報といった個人情報をGPSとしてマイナンバーカードに入れ込むこと自体がリスク 苗字も外字の存在を無くしてくれ
わたなべさんの漢字表記の違いとか多すぎやろ でもこの感覚自体はプログラマー側が認識すべきやろな そもそも名寄せとか無理あるわ
負担かけるけど入力ルール決めて国民に再度登録してもらった方がはるかにマシ >>117
バグ発生しまくってシステム障害起こすのがオチやろな >>116
マイナンバーカードも住所書いてるじゃん >>126
確実に丁目や番地だと分かってるものを変換するのはそんなに難しくない
どうやってそれが確実に丁目や番地なのかを調べるのは難しい どの程度正確さが必要かみたいなのは要件によるし
例えば書いてもらった住所に配達してもらって届くかでやる場合もあるし
自由入力を受けつけてそれを正規化するというのは住所固有の難しさでもないし 実際AIかなり有効だと思うわ
学習もやりやすそうだし >>132
輸入したときとかよくこんなんで届くなって住所になってたりするわ
部屋番号飛んでるとか当たり前やし 〇〇1丁目2番地3ってのは都市部やんか
大字〇〇1234-5みたいなのと同じような処理で大丈夫なんか 素人が
恥を晒す
Twitter
黒歴史は消せない
【ビットトレ一ドで
1500円もらおう!】
【6月末まで】
開設翌日朝6時にビットコイン1500円分付与されます
詳しくはこちら!
↓
https://i.imgur.com/TLOZPjz.jpg 上にいる人間はある程度無茶ぶりでもええと思うけど
ただそれを言っていいのは責任取れる人だけやな 存在する番地すべてにユニークなIDを振って国が公開するとかできんのか? ワイ有能「予めこちらで用意した住所から選択させます!」 >>141
家や街って新しく生まれたり消えたりするしな 余裕やろ
半角ハイフンと全角ハイフンと長音符と全角罫線を統一するくらいシステムでやれよ
半角と全角の使い分けとかいう面倒な行為なくせ エクセルで国の基幹情報管理してるってマジなのですか!?
表記揺れより余程問題やろ 全住所あらゆるパターン登録して近似値で修正かければいけるやろ😆 ○丁目○番○号
○丁目○-○
○-○-○
よくあるこの3つの揺らぎぐらいは入力時に自動補正かけろよとは思う そもそも住居表示と地番の違いも分からんでウダウダ議論してもなんの意味もねえのよ >>149
一太郎表計算ならOKとかそういう問題か? >>141
絶対初期データの入力間違えるぞ
年金データ入力どれだけまちがったとおもってるんや? >>151
まさにそれの話やろ
なぜかパソコンの大先生がTwitterで発狂しまくってるけど 役所が正の住所もってるやろ
住民票に書かれてる住所が正なんやから
役所が住民票データと紐づけて入力しろよ 表記揺れの根本的原因は住所の登録方法なんよね
これは国じゃなくて地方の問題 >>158
実家から出たことないから住所の表記方法のズレがあるって事実知らんのやろな そもそも全国民のCSVをエクセルで開けんし分割すんのかな
何分割になるだろうか 一旦エクセルで運用して問題が発生すれば謝る
これが有能ワイの解決策なんだよね >>147
マメというか大抵の社会人なら知ってるやろ >>164
いうて住居表示が実施されてるかされてないかくらいやろ
大字xxxx-xか大字x-x-xやろ? >>165
今ってExcelの最高行数なんぼなん? >>165
ちなみに今のインボイスの関連で登録事業者のリスト公開してるけどやばい量やぞ >>160
あんなん本人が転入届にどう書いたかに依存するからええ加減やぞ >>151
それすら難しいって話やろ
その3つにも例外多すぎてそこだけに限定した揺らぎ修正ができひんのや ExcelでできるレベルのことならJavaとかSQLとかでもできるやろ
なんで頭がExcelで全国民の住所開いて編集する前提になってる人がいるんだろう
これがパソコン大先生特有のアスペ感で嫌い 住所が丁がない場所もあるんやぞ
自動修正したら間違いなくあかん >>145
よく分かってなくてすまんが○○町1-2-3 みたいなのに全部ハッシュ値のユニークなIDを登録する、
それぞれ登録日、廃止日、変更後のIDみたいな情報を付けるのではいかんのか?
役所が把握してないところで勝手に番地とかが増えていくものなんか? 5ch県実況市大字なんでも実況G1686131341→5ch県実況市1686131341にすればええんやで >>175
転入届の住所、役所で直されるやろ
ハイフンとかで書いてると、ここ直しますねーって番地表記に変えられる >>171
ほんまにそう思ってるってことはガチで実家から出たことない学生なんか? 住所をなぁなぁで済ませてきてたのがここにきて効いてきたな >>158
え、うそやろ
もっとレアな住所表記パターンがあって網羅的に対応するのは厳しいって話ちゃうんか…? >>184
じゃあそれにそぐわないところは住所側を変更すればいいやん なんで郵便番号とかいう郵便屋しか得しない番号は国民に普及して住所番号は作成も普及もしなかったんやろな
作成されたのも明治時代とかじゃなくて1968年だしこの時住所番号も作ってくれて良かったやん 役所の台帳って基本的に紙やし死んでるはずの人物が書類上延々と生きてることあったりで割とメチャクチャやぞ >>183
自治体によるで
わいは前の住民票登録は丁目番号マンション名部屋番号表記やったがいまのマンション名なしの数字とハイフンだけで部屋番号まで記載されてる 正しい住所表記を定めたところで世間の人々が「正しくない」表記を日常に使っていて生活する上で通用してしまうから問題なんやで >>183
ワイ番地の下の号と部屋番号ごっちゃに書いたら通っちゃったんよね
だから今○丁目✕番地3-304号みたいな意味分からん住所になっとる 住所書かせなければええやん👍指紋声紋なんかで検索や! 地番と住居表示が違う人同じ人
大字ある人ない人
丁目書く人
番地って書く人と番としか書かない人
マンション名書く人と書かない人
ワイはプログラミングはさっぱりやけど住所ってほんま色んな人がおるで
プロは頑張ってくれ >>190
基本申請ベースだから無戸籍者とかも生まれるしな
国勢調査も全員が全員きちんと答えるわけじゃないし >>188
コスト度外視したらそうやろうけど、それが出来ないから困ってるって話やろ >>181
よく分かんないけど表記揺れがあっても同一のIDを生成できないと問題が起こるんじゃないのかな 当然やけど情報って勝手に揃うもんじゃないので
必要に迫られることもなく整理してこなかったもんが乱雑で難しいと言われても
なんの意外性もなくてつまらん 当然やけど情報って勝手に揃うもんじゃないので
必要に迫られることもなく整理してこなかったもんが乱雑で難しいと言われても
なんの意外性もなくてつまらん 住居表示最適化のレベル1関門の京都の通り表記の排除すら突破できなさそう >>199
新田(しんでん)と新田(にった)を混同して酷いことになりそう
人間ですらこの見分け付かんやろ 正規表現ってガチで力技すぎて笑えるよな
作ってる側は笑えないやろうけど こういうの想定していないケースが出てきてやらかす
ワイはよくやらかすから無理 手間に比べてリターンが少なすぎる
マイナンバーの100倍ごみ
絶対完成しないことを考えたら産業廃棄物 >>191>>193
マジか
そんなに適当やったんかアレ 2万件からの住所管理してたけど
まあそんな単純なら誰も苦労はしないんだよね
たった2万でも苦労は多い 実現できるならすでにされとるやろうから無理なんやろ そもそも宅配業者が住所信じてないからオリジナルの地図持ってるんやぞ ワイ田舎住み住所が
「〇〇市〇〇 数字四桁」やし多分突貫で作ったらやらかすやろw
字〇〇とかでてきたら膨大なパターンや 真面目にやるなら令和の太閤検地!みたいに銘打って全ての建物と部屋にIDを付ければいいと思う
それを個人に紐付ければええやろ。住所は段階的に廃止する
各地で存在しないはずの家が生まれたり消えたりするかもやけど いわゆる名寄せ処理だけど、置換処理やExcel程度では対応できないぞ
流石にこの市長候補が無知 こんな問題は、受注して下請けへ流す工程で結局市長候補みたいな内容になる金額で作業することになるんや
中抜き文化が根本原因 河野の発言がどういう意図なのかわからんけど、今無理して表記ゆれを完璧になくそうするとコストが掛かりすぎるから
将来的にコストとメリットが釣り合った時点で対応するってことならええやろ >>215
今の区割りが未来永劫続くならええが
番地って合体したり、分割されたりするもんやからな >>215
マイナンバーがあるなら部屋ナンバーもあっていいよな アホ「地名と番地部分の区別が出来ひん…」
天才ワイ「以下のCaptchaから番地部分を示すものをすべて選択してください」 住所に限らず名寄せってめちゃくちゃしんどいぞ
1個のデカいプロジェクトになるわ >>222
こういうである程度名寄せするだけで、かなりミスは減ると思うけどな >>222
readme読むだけでも分かる苦心具合で草 人の名前に揺らぎがあるんやぞ
地名に揺らぎがないわけがない
そもそも入力できないゴミ漢字まである そもそも郵便番号できたのって全て数字だけで管理してこういう問題解決するためやなかったん?
この前郵便局でキレ散らかしてた爺さんがそうわめいとったで >>7
オモロイなあ
でも、最近のIT屋はマジでこれをやるからなあ 住所の統一はよしてくれ
地名以下は全部番地でええやろ >>230
ある程度の範囲まで郵便番号で絞るってだけで
7桁の番号で一件一件管理できるわけない 「番」って漢字使ってる住所表記に−が表れる謎のバグ発生するやん >>199
無理です
住所正規化は人手じゃないと無理です >>219
将来的にって国民の重要な情報って言って無理やり普及させたんやからそんなん通るわけないやん
こんなところで躓くなら最初から無理や >>230
数字だけ管理したいまで思ってたのかね
同じ郵便番号で住所違うとかあるんよなあ >>233
わかっとるけど
元々それをやるっていうて導入したんちゃうの
それがこの現状ってのがおかしいやん 要は場所を特定できればいいから座標で管理すれば表記気にしなくていい ある程度正規化させて最後は人が確認するしかないやろ
そのために公務員がおるんやろ
パーフェクトな正規化ソフト作る手間に見合わん これ燃えすぎてて草や
住所も数字で管理するように政治でしてくれや
なんも困らんから ワイ実務で住所正規化やってたけど地獄やで
番地の1一2の真ん中がハイフンじゃなくてイチだったりするんやぞ 質問なんやけど、郵便物って郵便番号以外にもカスタマーバーコードで番地を読み込んでるじゃん
あれの中身ってやっぱ間違いだらけなん? 八丁堀や八丁目(町名)みたいなのもかなり強敵
八丁堀が8丁堀にはならんだろうけど町名の八丁目はどうにもならん >>240
郵便番号で一軒一軒管理しようという考えなんて元々ないと思うが エクセルバカは論外だけど
問題は日本の住所システムがガチでガバガバなのが問題や
一回マジで今の住所システムを廃止すべきや 住所にこそマイナンバー割り振れよ
数値なら表記揺れもクソもないやろ 郵便て、郵便局でいい感じにやってくれてるよな
微妙に間違ってても届くし 番地の手前までの住所をまとめたデータリストくらいありそうやけどな
それがあれがゴールは近そうやけど 役所のデータベースはどうなってるんや
セル3つに分けて、
セル1に町名まで
セル2に丁目番地号←半角数値と-
セル3に建物、部屋番号
普通こういうふうに管理せんか? >>249
本質は住所ちゃう
手入力のゆらぎの考慮が無理ゲーすぎるんや もう日本語めんどいから英語に公用語変更しようや
マジで文化とかくだらんから Excel APIの知名度低いな
あれガチで頑張ったんやなって力作やで >>244
ハイフンも見た目同じように見えてユニコード違うとかあるしな ちょっと考えるだけで妙なパターンが沢山浮かぶし住所の正規化とかうんざりするな
しかもPCで処理できるテキスト情報ならまだしも手書きだったらもう悪夢やね >>252
今やってる行為がそれやろ
住所とマイナンバーの紐付け 長野県 長野市 南長野 県町
これ謂われてはえーってなったわ >>239
14桁あればいける
マンションまで対応するなら19桁欲しいね 所有者不明の不動産の扱い決める法律施行した後一斉に住所のルール変えて再設定した方がええやろ
どこかで大失血しながら変えないと将来的にとんでもない非合理の積み重ねになる まぁ確かにAIで頑張ってどうこうするくらいなら、住所のシステムを変えた方が合理的な気はする
それが出来んからこういう話になるんだろうけど >>271
人が住んでないとこには住所とは別に地番がある 平成の大合併がなかったらまだ住所が面倒なことにはならなかったんだよ
あれを国が強要したせいで飛び地合併が多発したり自治体名と元の名前が合わないのが多く生まれた
戦犯は合併を強要した国だ ・番地や地名に漢数字や「番」「丁」その他の紛らわしい文字を使用・記入してはいけない
↑こういう法律を作ればいけると思う? これごときで親の仇を取ったように騒ぐエンジニアとは一体… >>273
むしろあれをやらなかったと考えたら地獄絵図やわ >>276
それはあり得ない
自治体からすらも合併前に戻したいという声が多い現状に合併解消の選択肢も選ばせるべきだ >>274
ぶっちゃけ郵便番号さえあれば、
原則として丁目、街区、住居番号以外の情報は不要なんやけどな >>278
そんなことしたら地方公共団体としての広域連合が増えそう 住所書くとかいう行為が無駄すぎるから早く固有番号割り振ってそれ書かせるようにしろ 住所じゃなくて住所ごとに固有の識別番号割り当てて住民にそれ書かせればええだけだよね >>287
全部番号にしたら
上の方の桁の番号間違えて、とんでもない住所に誤配送される事例が増えそうや Excel APIええやん
役所に使わせたらDoS攻撃みたいになりそうだけど >>280
たまに思うけど市とか区とか書かされるの完全に要らん作業よな
数字だけ書けばいいと考えるとよく出来たシステムに思える
表記の工夫でどこまで改善できるんかも分からんけど >>293
誰でも知ってるやろ
誤配送防止のためにあえて消さんだけで >>287
実際には住所って数字だけで表せるからほぼ固有番号があるようなもんなんやけどな >>291
番号入れたら住所表示して確認できるようにしたらいいやん >>292
作者に頭上がらんでほんま
普通に実務で使わせてもらっとる >>295
いや、知らんやつのほうが多いで
なんなら郵便局員ですら少数派や >>290
ガイジそう
英数字使えばいいだけだよね >>299
ま?
通販サイトとかでも郵便番号入れたら番地の前まで勝手に入るんやから分かりそうなもんやが そもそも所在地の正しい表記は定められてないという論点が無いからエクセルガーになるんやろな >>299
いやさすがに郵便局員がわからんやつが多数派なわけないやろどんな根拠持ってそんなこと言ってるんや 郵便番号と番地と住居まで絞り込める番号の2つを併用するようにするだけでこの問題は解決されるんだよなあ ■ このスレッドは過去ログ倉庫に格納されています