미국 한인 IT 신입 Data 엔지니어 가이드 — Analyst · Scientist · Engineer (2026)

뉴비1시간 전
1 0 0
https://gousa.kr/board/jobs/2321

Data 직군 — Analyst → Scientist → Engineer 의 3 갈래

2026 미국 Data 직군은 3개 트랙 — Data Analyst, Data Scientist, Data Engineer + 신흥 Analytics Engineer, ML Engineer, AI Engineer 로 나뉜다. 학사 한인 신입에게 가장 진입 쉬운 자리는 Data Analyst, 학사+SQL+Python 으로 가능. Data Scientist 는 MS+ 권장, Data Engineer 는 backend 경험 + Spark/Airflow 깊이 필요. 2024-2025 AI 도입으로 단순 분석은 LLM 으로 대체되는 압박이 있는 반면, analytics engineering + ML platform + dbt + Snowflake / Databricks 같은 modern data stack 영역은 채용 활발하다.

Data 3 직군 비교 (FACT)

  • Data Analyst — SQL + BI tool + 비즈니스 의사결정. BS 충분. TC $80K-150K
  • Data Scientist — Statistics + ML modeling + experiment. MS/PhD. TC $140K-280K
  • Data Engineer — Pipeline ㆍ data warehouse ㆍ infra. BS+. TC $140K-280K
  • Analytics Engineer (신흥) — dbt + warehouse modeling + semantic layer. BS. TC $140K-220K
  • ML Engineer — Production ML pipeline. BS+. TC $180K-450K (FAANG)
  • Research Scientist (Data) — Causal inference / experiment design / new methods. PhD. TC $200K-500K

2026 Data 시장 (FACT + [INFERENCE])

  • FAANG Data Scientist L3 — Meta E3 약 $193K, Google L3 약 $185K
  • Data Engineer 시장 부족 — Snowflake / Databricks / dbt 경험자 시급 부족
  • Modern Data Stack 회사 — dbt Labs, Fivetran, Hex, Hightouch, Census, Astronomer (Airflow)
  • 한국계 Data team — Coupang Seattle data org, NAVER LA, Toss US 데이터
  • 금융 Quant Researcher — Two Sigma ㆍ Citadel ㆍ Jane Street ㆍ HRT. Senior $500K-2M+

Data Analyst — 가장 빠른 entry (FACT)

  • SQL 깊이 — Window function ㆍ CTE ㆍ partitioning ㆍ query optimization
  • Python pandas / Polars — DataFrame 조작
  • BI — Tableau ㆍ Looker ㆍ Power BI ㆍ Mode ㆍ Hex ㆍ Superset
  • Experimentation — A/B test, statistical significance, sample size
  • Storytelling — 데이터 → 비즈니스 액션. 가장 중요한 soft skill

Data Engineer 스택 (FACT)

  • Warehouse — Snowflake ㆍ BigQuery ㆍ Redshift ㆍ Databricks
  • Lakehouse — Databricks Delta ㆍ Iceberg ㆍ Hudi
  • Orchestration — Airflow ㆍ Dagster ㆍ Prefect ㆍ Mage
  • Transform — dbt (de facto) ㆍ SQLMesh ㆍ Spark
  • Streaming — Kafka ㆍ Flink ㆍ Materialize ㆍ Beam
  • CDC (Change Data Capture) — Debezium ㆍ Fivetran ㆍ Airbyte
  • Reverse ETL — Hightouch ㆍ Census
  • Catalog — DataHub ㆍ Amundsen ㆍ Atlan ㆍ Collibra
  • Quality — Great Expectations ㆍ Soda ㆍ Monte Carlo

Data Scientist 스택 (FACT)

  • Statistics — Hypothesis testing ㆍ Bayesian ㆍ causal inference
  • ML — scikit-learn ㆍ XGBoost / LightGBM ㆍ PyTorch ㆍ statsmodels
  • Experimentation platform — Optimizely ㆍ LaunchDarkly ㆍ Statsig ㆍ in-house A/B
  • NLP / CV — Hugging Face Transformers ㆍ spaCy ㆍ OpenCV
  • Notebook — Jupyter ㆍ JupyterLab ㆍ Colab ㆍ Hex ㆍ Deepnote

인터뷰 구조 (FACT)

  • Data Analyst — SQL screen (LeetCode SQL + StrataScratch) → A/B test case → Behavioral
  • Data Engineer — SQL + Python coding → Pipeline design + warehouse modeling → Behavioral
  • Data Scientist — SQL + Python ML → Case (analytics 문제) → ML modeling → Behavioral
  • ML Engineer — Coding + ML system design + ML concept depth → Behavioral

Portfolio — 한인 신입 Data (FACT + [INFERENCE])

  • Kaggle competition — Top 10% 1-2개. Bronze 이상
  • Tableau Public / Looker Studio Dashboard 3-5개 — 실제 데이터
  • End-to-end project — Scrape → warehouse → dbt model → dashboard
  • Blog — 분석 사례 / SQL trick / dbt pattern
  • 오픈소스 — dbt package ㆍ Airflow plugin ㆍ Great Expectations expectation

한인 신입 Data — 추천 단계

  1. Step 1 — SQL 깊이 + Python pandas — 학부 2-3학년
  2. Step 2 — 트랙 결정 — Analyst / Scientist / Engineer 중 하나
  3. Step 3 — 인턴 1-2회 — Big Tech / 스타트업 / consulting
  4. Step 4 — Modern Data Stack hands-on — Snowflake free tier + dbt + GitHub Actions
  5. Step 5 — Portfolio 3-5개 + blog
  6. Step 6 — Big Tech + mid + 한국계 sweep

출처

dbt Labs, Snowflake, Databricks, Apache Airflow, Kaggle, StrataScratch (SQL interview).


※ Data 시장ㆍ도구 트렌드는 빠르게 변합니다. 본 글은 2026-05 기준 일반 가이드. 실제 지원 전 회사별 stack 확인, mock interview, 비자 변호사 자문 권장.

AD

댓글

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!