Python
この記事はenechain Advent Calendar 2024の14日目の記事です。 はじめに こんにちは。enechainで統計・機械学習モデルの構築やLLM(大規模言語モデル)の活用推進を担当している@udon_tempuraです。 私達のチームでは、以前紹介した会議動画要約のノウハウ…
データサイエンスチームが社内向けStreamlitアプリケーションを共通GKEクラスタ上で運用し、開発効率とセキュリティを両立させた事例を紹介します。
機械学習モデルの構築・運用を効率化するために作成した、Pythonのタスクランナーinvokeとパラメータ管理ツールhydraを統合したシステムを紹介します。
enechainではリスク計算の基盤としてBigQueryを使っています。しかし、テスタビリティやモジュール化、クエリやテーブルの依存関係の管理に課題があります。そこでbigframes.pandasを検証し、実運用を想定した検討をしました。
本記事では、データ品質向上を目標に、ロギングを適切に設計・実装する手法をご紹介します。enechainのプロダクトをデータの側面から支える我々が、どのような方法でロギングを構築したかを実コードを交えながらご説明します。
enechainでは、機械学習や最適化アルゴリズムを用いて電力などの商品に関する指標を算出し、社内外に提供しています。その中でも特に正確さが求められる数値について、社内のドメインエキスパートが介入する運用を効率化するためにSlackを利用して構築したHu…
enechainでは機械学習や数理最適化をプロダクトや業務において活用しています。この記事では、データサイエンティストがPoCレベルを脱却して、本番システムの開発を行うためのTipsを紹介します。