미국 한인 IT 신입 Data 엔지니어 가이드 — Analyst · Scientist · Engineer (2026)
조회수 1추천수 0댓글 0
https://gousa.kr/board/jobs/2321
Data 직군 — Analyst → Scientist → Engineer 의 3 갈래
2026 미국 Data 직군은 3개 트랙 — Data Analyst, Data Scientist, Data Engineer + 신흥 Analytics Engineer, ML Engineer, AI Engineer 로 나뉜다. 학사 한인 신입에게 가장 진입 쉬운 자리는 Data Analyst, 학사+SQL+Python 으로 가능. Data Scientist 는 MS+ 권장, Data Engineer 는 backend 경험 + Spark/Airflow 깊이 필요. 2024-2025 AI 도입으로 단순 분석은 LLM 으로 대체되는 압박이 있는 반면, analytics engineering + ML platform + dbt + Snowflake / Databricks 같은 modern data stack 영역은 채용 활발하다.
Data 3 직군 비교 (FACT)
- Data Analyst — SQL + BI tool + 비즈니스 의사결정. BS 충분. TC $80K-150K
- Data Scientist — Statistics + ML modeling + experiment. MS/PhD. TC $140K-280K
- Data Engineer — Pipeline ㆍ data warehouse ㆍ infra. BS+. TC $140K-280K
- Analytics Engineer (신흥) — dbt + warehouse modeling + semantic layer. BS. TC $140K-220K
- ML Engineer — Production ML pipeline. BS+. TC $180K-450K (FAANG)
- Research Scientist (Data) — Causal inference / experiment design / new methods. PhD. TC $200K-500K
2026 Data 시장 (FACT + [INFERENCE])
- FAANG Data Scientist L3 — Meta E3 약 $193K, Google L3 약 $185K
- Data Engineer 시장 부족 — Snowflake / Databricks / dbt 경험자 시급 부족
- Modern Data Stack 회사 — dbt Labs, Fivetran, Hex, Hightouch, Census, Astronomer (Airflow)
- 한국계 Data team — Coupang Seattle data org, NAVER LA, Toss US 데이터
- 금융 Quant Researcher — Two Sigma ㆍ Citadel ㆍ Jane Street ㆍ HRT. Senior $500K-2M+
Data Analyst — 가장 빠른 entry (FACT)
- SQL 깊이 — Window function ㆍ CTE ㆍ partitioning ㆍ query optimization
- Python pandas / Polars — DataFrame 조작
- BI — Tableau ㆍ Looker ㆍ Power BI ㆍ Mode ㆍ Hex ㆍ Superset
- Experimentation — A/B test, statistical significance, sample size
- Storytelling — 데이터 → 비즈니스 액션. 가장 중요한 soft skill
Data Engineer 스택 (FACT)
- Warehouse — Snowflake ㆍ BigQuery ㆍ Redshift ㆍ Databricks
- Lakehouse — Databricks Delta ㆍ Iceberg ㆍ Hudi
- Orchestration — Airflow ㆍ Dagster ㆍ Prefect ㆍ Mage
- Transform — dbt (de facto) ㆍ SQLMesh ㆍ Spark
- Streaming — Kafka ㆍ Flink ㆍ Materialize ㆍ Beam
- CDC (Change Data Capture) — Debezium ㆍ Fivetran ㆍ Airbyte
- Reverse ETL — Hightouch ㆍ Census
- Catalog — DataHub ㆍ Amundsen ㆍ Atlan ㆍ Collibra
- Quality — Great Expectations ㆍ Soda ㆍ Monte Carlo
Data Scientist 스택 (FACT)
- Statistics — Hypothesis testing ㆍ Bayesian ㆍ causal inference
- ML — scikit-learn ㆍ XGBoost / LightGBM ㆍ PyTorch ㆍ statsmodels
- Experimentation platform — Optimizely ㆍ LaunchDarkly ㆍ Statsig ㆍ in-house A/B
- NLP / CV — Hugging Face Transformers ㆍ spaCy ㆍ OpenCV
- Notebook — Jupyter ㆍ JupyterLab ㆍ Colab ㆍ Hex ㆍ Deepnote
인터뷰 구조 (FACT)
- Data Analyst — SQL screen (LeetCode SQL + StrataScratch) → A/B test case → Behavioral
- Data Engineer — SQL + Python coding → Pipeline design + warehouse modeling → Behavioral
- Data Scientist — SQL + Python ML → Case (analytics 문제) → ML modeling → Behavioral
- ML Engineer — Coding + ML system design + ML concept depth → Behavioral
Portfolio — 한인 신입 Data (FACT + [INFERENCE])
- Kaggle competition — Top 10% 1-2개. Bronze 이상
- Tableau Public / Looker Studio Dashboard 3-5개 — 실제 데이터
- End-to-end project — Scrape → warehouse → dbt model → dashboard
- Blog — 분석 사례 / SQL trick / dbt pattern
- 오픈소스 — dbt package ㆍ Airflow plugin ㆍ Great Expectations expectation
한인 신입 Data — 추천 단계
- Step 1 — SQL 깊이 + Python pandas — 학부 2-3학년
- Step 2 — 트랙 결정 — Analyst / Scientist / Engineer 중 하나
- Step 3 — 인턴 1-2회 — Big Tech / 스타트업 / consulting
- Step 4 — Modern Data Stack hands-on — Snowflake free tier + dbt + GitHub Actions
- Step 5 — Portfolio 3-5개 + blog
- Step 6 — Big Tech + mid + 한국계 sweep
출처
dbt Labs, Snowflake, Databricks, Apache Airflow, Kaggle, StrataScratch (SQL interview).
※ Data 시장ㆍ도구 트렌드는 빠르게 변합니다. 본 글은 2026-05 기준 일반 가이드. 실제 지원 전 회사별 stack 확인, mock interview, 비자 변호사 자문 권장.