Census(センサス)は、Entity Resolutionと呼ばれる最先端の機能を発表した。この革新的な機能は、さまざまなビジネスデータにおける重複レコードを識別、統合、解決するように設計されている。Entity Resolutionが従来のツールと異なる点は、ビジネスエコシステム内のあらゆるデータセットに対応できることだ。これには、ウェアハウステーブル、CRMデータ、ストリーミングソース、CSVアップロード、そしてCensusに接続されたその他のあらゆるソースが含まれる。
Entity Resolutionには、さまざまな主要機能が搭載されている。その1つが、あいまい一致を伴う決定論的ルールだ。これにより、設定可能な類似度しきい値を用いて、クリーンで信頼性の高いレコードを作成できる。しきい値は、低、中、高のいずれかに設定できる。もう1つの注目すべき機能は、カスタマイズ可能なマージルールだ。これにより、重複が見つかった場合にどのレコードを「優先」するかを決定できる。
この機能には、高度な残存ルールも含まれている。これにより、企業は最新、最も頻繁に使用される、最高値、非NULL優先、カスタム優先ロジックなどのオプションを使って、どのデータを残すかをインテリジェントに選択できる。さらに、Entity Resolutionでは柔軟な出力モードも利用できる。企業は、クリーンなレコードのみを含むマージモードと、メタデータを含む全てのレコードを含む重複としてマークするモードを選択できる。
Entity Resolutionは、データセット間の変換機能も提供する。つまり、重複除去されたデータはCensus Storeに保存されるため、企業はこのクリーンなデータと他のソースのデータを参照するSQLクエリーを作成できる。また、ウェアハウスに同期することも可能だ。この機能は既存のCensusワークフローと統合されているため、AI列、サードパーティーのエンリッチメント、その他の機能と組み合わせることができる。つまり、重複除去されたデータを他のデータセットと併用することで、チーム間で統合された分析が可能になる。
Censusの新しいEntity Resolution機能は、企業にデータ全体の重複レコードを管理・解決するための強力なツールを提供する。幅広い機能と柔軟性により、ビジネスデータ管理の世界を革新することが期待される。
出典:Census
この製品の詳細については、製品ページをご覧ください。