Data Engineering

ワークフロー、タスクで見るか?データで見るか?

この記事は enechain Advent Calendar 2023 の22日目の記事です。 はじめに 現行のデータパイプライン 現状の課題 課題解決へのアプローチ 1. 処理の依存関係視覚化問題への対応 2. 処理とデータの関係性問題への対応 3. データリネージ問題への対応 Task-ce…

データ品質向上を見据えたロギングプラクティス

本記事では、データ品質向上を目標に、ロギングを適切に設計・実装する手法をご紹介します。enechainのプロダクトをデータの側面から支える我々が、どのような方法でロギングを構築したかを実コードを交えながらご説明します。

メガベンチャーからスタートアップのデータ基盤に転職した話

メガベンチャーを中心に働いてきた私がenechainというアーリーステージのスタートアップのデータ基盤チームで働くことになりました。今回は働く中で感じたデータプラットフォームを構築する背景や求められる役割の違いについて紹介します。

データサイエンティストが本番システムを開発する上でのTips

enechainでは機械学習や数理最適化をプロダクトや業務において活用しています。この記事では、データサイエンティストがPoCレベルを脱却して、本番システムの開発を行うためのTipsを紹介します。

GCPにおける共通ログ基盤の構築

enechainでは複数のGCPプロジェクトに跨るアプリケーションのログの統合管理を目的とし、ログルーター機能を用いたログ共通基盤を作成しています。この機能の利用方法を、簡単な実装サンプルとともに紹介します。

Great Expectationsで始めるデータ品質監視

enechainのデータパイプラインにデータ品質監視ツールを導入する過程で得た知見を共有し、データ品質向上を目指す皆さんに役立つ情報が提供できれば幸いです。