Dataflow 과정 시리즈의 두 번째 편에서는 Beam SDK를 사용하여 파이프라인을 개발하는 방법을 자세히 살펴보겠습니다. 먼저 Apache Beam 개념에 대한 복습부터 시작하겠습니다. 다음으로 윈도우, 워터마크, 트리거를 사용하여 스트리밍 데이터를 처리하는 방법을 알아봅니다. 그런 다음 파이프라인의 소스 및 싱크 옵션, 정형 데이터를 표현하는 스키마, State 및 Timer API를 사용하여 스테이트풀(Stateful) 변환을 수행하는 방법을 다룹니다. 이제 파이프라인 성능을 극대화하는 데 도움이 되는 권장사항을 살펴보겠습니다. 과정의 마지막 부분에서는 Beam에서 비즈니스 로직을 표현하기 위한 SQL과 DataFrame을 소개하고 Beam 노트북을 사용하여 파이프라인을 반복적으로 개발하는 방법을 알아봅니다.

Dataflow를 사용한 서버리스 데이터 처리: 파이프라인 개발

Gain insight into a topic and learn the fundamentals.
Advanced level
Designed for those already in the industry
2 weeks to complete
at 10 hours a week
Flexible schedule
Learn at your own pace
What you'll learn
Google Cloud의 데이터 엔지니어링 과정에서 다룬 주요 Apache Beam 개념 복습
DE에서 다룬 핵심 스트리밍 개념(unbounded PCollection, 윈도우, 워터마크, 트리거) 복습
Dataflow 파이프라인에 사용할 I/O 선택 및 조정
스키마를 사용하여 Beam 코드를 간소화하고 파이프라인 성능 개선
Details to know

Shareable certificate
Add to your LinkedIn profile
Recently updated!
May 2026
Assessments
8 assignments
Taught in Korean
91%
of learners achieved a positive career outcome
See how employees at top companies are mastering in-demand skills

There are 10 modules in this course
Instructor

Offered by
Why people choose Coursera for their career

Felipe M.
Learner since 2018
"To be able to take courses at my own pace and rhythm has been an amazing experience. I can learn whenever it fits my schedule and mood."

Jennifer J.
Learner since 2020
"I directly applied the concepts and skills I learned from my courses to an exciting new project at work."

Larry W.
Learner since 2021
"When I need courses on topics that my university doesn't offer, Coursera is one of the best places to go."

Chaitanya A.
"Learning isn't just about being better at your job: it's so much more than that. Coursera allows me to learn without limits."




