データ整備入口タスクデータ品質
同じデータが2つある…を直す仕事、GXでは?
GXでの正式名称
重複データの排除
重複レコードを特定し正しいデータに一本化する
日常語→GX語 変換表
普段使っている言葉が、GX業界ではこう呼ばれます。
| 日常語(あなたの言葉) | GX語(業界用語) |
|---|---|
| 重複削除 | データ重複排除 |
| 二重計上 | ダブルカウント |
具体的にやること
- 1データ一覧から重複を検索する
- 2どちらが正しいか判断し、不要分を削除する
- 3削除履歴を記録する
求められるスキル
- Excelでの重複検索
- データの正誤を判断する力
- 履歴管理の習慣
ミニ知識
重複があると排出量が二重計上されます。正確な算定のために重複排除は必須です。
よくある質問
Q. 重複はなぜ起きるのですか?
複数部署からの報告、システム連携の不具合、手入力ミスなどで発生します。
この仕事について
この仕事で実際にやること
データ一覧から重複している項目を検索し、どちらが正しいかを判断して不要な方を削除します。削除した履歴を記録し、後から確認できる状態にします。重複を排除したデータは、そのまま集計に使われます。
なぜ人の手でやる必要があるのか
同じデータが2件あると、集計時に二重計上になります。複数部署からの報告、システム連携の不具合、手入力ミスなど、重複は様々な原因で発生します。どちらが正しいかを判断する工程は、人の確認がないと成立しません。
この仕事を経験すると、次に何ができるか
この作業を通じて、重複の発生パターン、正しいデータの見分け方、削除時の記録方法が身につきます。次のステップとして、重複防止ルールの整備、入力時のチェック改善といった業務に関わることができます。
この工程が使われる場面
データが集計・算定に使われる場合
※ この業務は、プロジェクト全体の一部を担う実務です。単独で成果を完結させるものではありませんが、この工程が欠けると、後続の集計・確認・提出作業が成立しません。
こんな経験が活かせます
「データの重複を削除」
入口タスクとは
GX実務への最初の一歩。特別な知識がなくても始められます。
次のステップ
このタスクを経験した後、以下のような職務にステップアップできます。