Articles
About TechHub
Tags
Careers
なむ
numb_86
ソフトウェアエンジニア
ソフトウェアエンジニアです。
なむ
2026-01-26
...
「手段」ではなく「課題」から考え取り組むデータパイプラインの信頼性改善
私は現在 HERP のデータプラットフォームの構築や運用を行っているが、このデータプラットフォームは以前、信頼性や障害検知に大きな問題を抱えていた。 以下の記事で少し触れたように、ニーズを満たすために
なむ
2026-01-24
...
ファイルディスクリプタのノンブロッキングモードについて
ファイルディスクリプタは様々な「フラグ」を持っており、各フラグが有効かどうかでプログラムの挙動が様々に変化する。 この記事の内容は以下の環境で動作確認を行った。 $ lsb_release -a No
なむ
2026-01-11
...
『入門 監視』を読んだ
IT システムの監視についての入門書。 www.oreilly.co.jp 「問題が起きていることが分かるようにする」と「問題の原因を調査できるようにする」を明確に分けていることが印象に残った。 そ
なむ
2025-12-24
...
重要な Pod の優先度を設定することでスケジューリングされやすくする
Kubernetes の Pod にはpriorityという属性があり、その名の通り Pod の優先度を示している。 priorityを高く設定することで、 Node へのスケジューリングが行われやす
なむ
2025-12-07
...
I/O 多重化で TCP サーバの並行処理能力を改善する
I/O とはデータの入出力のことであり、ネットワークプログラミングの文脈では「ネットワーク経由でのデータの送受信」を指すことが多い。そして、サーバが複数のクライアントの対応を同時に行う場合、複数の I
なむ
2025-12-03
...
素朴なイベントループを書いて epoll を理解する
epoll は様々な「イベント」の発生を検知できるようにするためのシステムコール。これを使うことで、「リスニングソケットに接続要求が来た」「ソケットにデータが到着した」などのイベントの発生を、カーネル
なむ
2025-11-17
...
Kubernetes クラスタでホスティングしている Metabase が出力するログを JSON 形式にする
ウェブアプリケーションのモニタリングやオブザーバビリティを実現していくための要素のひとつに、ログがある。 しかしアプリケーション(今回の場合は Metabase)が出力するログが適切に構造化されていな
なむ
2025-11-05
...
Pod が配置される Node を Taint と Toleration で制御する
Kubernetes には Taint と Toleration という仕組みがあり、これらを使うことで Pod が配置される Node を制御できる。この Node にはこの Pod しか配置を許可
なむ
2025-10-26
...
『WEB+DB PRESS Vol.55』の「モダンネットワークプログラミング入門」を読んだ
ネットワークプログラミングの基本的な用語や概念、 I/O 戦略の代表的なパターン、について書かれた特集記事。 15 年前の特集記事で、執筆者は古橋貞之氏。 ちなみにこの特集の次のページでは伊藤直
なむ
2025-10-09
...
短いサイクルで意思決定を繰り返してデータガバナンスを漸進的に改善していく
自分の現在の主業務はデータプラットフォームの構築や運用だが、その文脈でここ数ヶ月取り組んでいたことのひとつに、データガバナンスがある。 データを利活用したい人がより安全かつ便利に利活用できるようにして
なむ
2025-09-12
...
Google Cloud のデータプロファイル機能で BigQuery のデータを継続的に検査する
Google Cloud の Sensitive Data Protection には「データプロファイル」と呼ばれる機能がある。 データプロファイルは Google Cloud コンソールから操作す
なむ
2025-09-07
...
『ふつうのLinuxプログラミング 第2版 Linuxの仕組みから学べるgccプログラミングの王道』を読んだ
いわゆる「システムプログラミング」の入門書。 本当に初学者向けの入門書であり、カーネルとは、システムコールとは、というところから説明していく。 ファイルシステム、プロセス、ストリーム、が本書の軸にな
なむ
2025-08-15
...
データ領域の Platform Engineering と「データ利活用体験」の向上
ソフトウェア開発をよりよいものにしていくための取り組みのひとつとして Platform Engineering という考え方がある。 私は現在データプラットフォームの構築や運用を行っているが、その名の
なむ
2025-07-12
...
BigQuery ポリシータグによるカラム単位でのアクセス制御と dbt によるポリシータグの付与
BigQuery にはポリシータグという仕組みがあり、これを使うことで BigQuery のリソースに対してきめ細やかなアクセス制御を行うことができる。 ポリシータグの仕組み ポリシータグは、それ自体
なむ
2025-05-29
...
Claude Code(Claude Sonnet 4) に Google Cloud + dbt のデータパイプラインを作らせてみる
自分ではコーディングやコマンドの実行などを行わずプロンプトによる指示だけで進める、いわゆる「バイブコーディング」で開発を行った。 元々自分は AI コーディングに詳しくなく、プロンプトエンジニアリング
なむ
2025-05-13
...
Cloud DLP を使って BigQuery に入っている個人情報を検知する
Cloud Data Loss Prevention (以下 Cloud DLP) は機密データを保護するための Google Cloud のサービス。渡したデータや指定したストレージに入っているデー
なむ
2025-02-13
...
データエンジニアリングって何が面白いんだ?
最近『データエンジニアリングの基礎』という本を読み始めた。 そんな状態なので、各組織の各データエンジニアが何をしているのか外からはよく分からないだろうし、データエンジニアが何に面白さを感じているのかも
なむ
2025-02-06
...
dbt の Python model を Dataproc クラスタで実行する
dbt には Python model という仕組みがある。これを使うことで SQL ではなく Python で model を書くことができ、SQL では不可能な処理が可能になる。 この記事の内容は
なむ
2025-01-30
...
Dataproc クラスタで PySpark ジョブを実行して学ぶサービスアカウントの初歩
Dataproc は Google Cloud が提供しているサービスのひとつ。Dataproc を使うことで、Apache Spark や Hadoop を利用するためのインフラを簡単に用意すること
なむ
2025-01-23
...
『GitLabに学ぶ 世界最先端のリモート組織のつくりかた ドキュメントの活用でオフィスなしでも最大の成果を出すグローバル企業のしくみ』を読んだ
現職はリモートワーク可能であり、自分はフルリモートで働いている。 www.shoeisha.co.jp フルリモートで上手く機能している組織、として真っ先に挙がるのが GitLab だと思う。世界各国
prev
1
2
3
next