大手データ管理プラットフォームであるCensusは、増大するデータストレスの問題に対処するこの革新的な機能であるCensus Datasetsを発表した。信頼できるデータの共有された単一のビューを作成し、データの探索とモデリングを簡素化。ユーザーが自信を持ってデータを同期できるようにし、データ管理のストレスを軽減する。Datasetsは現在、全てのCensusユーザーが利用できる。今後6力月間で、データチームがデータを統合、管理、検証できるように、さらに多くの機能を構築する予定だ。
Datasetsは、企業が共有データ定義を拡張および強化するためのより強力な方法を提供するように設計されている。Datasets同士の結合も可能で、カスタム計算フィールドや数式などのカスタムプロパティーで強化することもできる。これらは全てCensus内で行われる。Datasetsは、SQL、dbt、Python、Looker、Sigma、HTTP、Kafkaなどの複数のソースを単一のビューでサポートする。この独自の機能により、データチームは全てのデータソースを1カ所で表示および検出できる。
Datasetsは、データサイロを克服するだけでなく、データチームとビジネスチーム間のコラボレーションを促進する。この機能により、ビジネスチームは実際のデータに近づき、データリクエストのやり取りを減らすことができる。Computed列を使用すると、ビジネスチームと運用チームはカスタム計算と顧客プロパティーを共有Datasetsに直接追加できる。これにより、生涯価値の列を作成したり、リードに会社規模を追加したりするなど、仕上げのデータ変換を非常に簡単に実行できる。Computed列は今後も追加される予定だが、現在は以下の3種類が使用できる。
- Rollup列:関連するデータセットからカウント、合計、最小、最大値またはレコードを検索
- Text Transform列:Liquid テンプレートを使用してテキスト変換 (およびその他) を実行
- Calculated列:関連するデータセットの差異、平均、および変更を計算
Censusは、データ品質の低さという問題にもDataset Explorerで対処している。これは、データチームとビジネス チームの両方がCensusがアクセスできる全ての情報を表示できる単一の画面だ。Dataset Explorerでは、まもなく、充填率やメタデータなどのデータヘルスメトリクスを確認できるようになる。もう1つの近日公開予定の機能は、Entity Resolutionだ。これにより、ユーザーは複数のデータセット内のレコードを識別して結合できる。これは、全てのビジネスオブジェクトにわたって大規模なデータセットをクリーンアップして維持するための総合的な方法だ。
Censusの新しいDatasets機能は、データストレスの軽減とデータ管理の改善に向けた重要なステップだ。データサイロと品質の問題を克服するための機能がデータチームに提供され、ビジネスチームが信頼できるデータレイヤーに貢献できるようになる。
出典:Census
この製品の詳細については、Census製品ページをご覧ください。