Post

[Spark] AWS Elastic MapReduce(EMR)

[Spark] AWS Elastic MapReduce(EMR)

๐Ÿ“Œ Elastic MapReduce๋ž€?

AWS Elastic MapReduce(EMR) ๋Š” ๋น…๋ฐ์ดํ„ฐ ํด๋Ÿฌ์Šคํ„ฐ ๊ด€๋ฆฌ ์„œ๋น„์Šค์ด๋‹ค. AWS๊ฐ€ ์•Œ์•„์„œ ์ŠคํŒŒํฌ๋‚˜ ํ•˜๋‘ก ํด๋Ÿฌ์Šคํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. ๋„คํŠธ์›Œํฌ ์„ค์ •์ด๋‚˜ ๋ฒ„์ „ ํ˜ธํ™˜ ๋ฌธ์ œ๋ฅผ ์•Œ์•„์„œ ํ•ด๊ฒฐํ•˜๋ฉฐ, ๋…ธ๋“œ์— ์žฅ์• ๊ฐ€ ๋ฐœ์ƒํ•˜๋ฉด ์ž๋™์œผ๋กœ ๊ฐ์ง€ํ•˜์—ฌ ๋Œ€์ฒด ๋…ธ๋“œ๋ฅผ ๋„์šด๋‹ค.

๐Ÿ“Œ ํŠน์ง•

ํด๋Ÿฌ์Šคํ„ฐ์˜ ๋ถ€ํ•˜๋ฅผ ์ง€์†์ ์œผ๋กœ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜์—ฌ ๋ถ€ํ•˜๊ฐ€ ์ฆ๊ฐ€ํ•˜๋ฉด ์ž๋™์œผ๋กœ ๋…ธ๋“œ๋ฅผ ์ถ”๊ฐ€ํ•œ๋‹ค. ํ•ญ์ƒ ์ตœ๋Œ€ ๋ถ€ํ•˜์— ๋งž์ถฐ ๊ฑฐ๋Œ€ํ•œ ํด๋Ÿฌ์Šคํ„ฐ๋ฅผ ํ•ญ์ƒ ์œ ์ง€ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ํ•„์š”ํ•œ ๋งŒํผ ๋ฆฌ์†Œ์Šค๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

EMR์€ Spot Instances ๊ธฐ๋Šฅ์„ ์ œ๊ณตํ•œ๋‹ค. AWS์˜ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์ž์›์„ ์˜จ๋””๋งจ๋“œ ์ธ์Šคํ„ด์Šค ๋Œ€๋น„ ์ตœ๋Œ€ 90%๊นŒ์ง€ ์ €๋ ดํ•˜๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์ธ๋ฐ, ์ด๋ฅผ ํ†ตํ•ด ๋น…๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋น„์šฉ์„ ์ค„์ผ ์ˆ˜ ์žˆ๋‹ค. ๋˜ํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋น„๊ต์  ์ €๋ ดํ•œ S3์— ์˜๊ตฌ์ ์œผ๋กœ ์ €์žฅํ•˜๊ณ  ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•  ๋•Œ EMR ํด๋Ÿฌ์Šคํ„ฐ๋ฅผ ์‹œ์ž‘ํ•œ๋‹ค. ์ด๋Š” ํ•ญ์ƒ ํด๋Ÿฌ์Šคํ„ฐ๋ฅผ ์œ ์ง€ํ•จ์œผ๋กœ์จ ๋ฐœ์ƒํ•˜๋Š” ๋น„์šฉ์„ ์ ˆ๊ฐ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค.

๋˜ํ•œ S3, CloudWatch์™€ ๊ฐ™์€ ๋‹ค๋ฅธ AWS ์ƒํƒœ๊ณ„์™€ ์™„๋ฒฝํ•˜๊ฒŒ ํ†ตํ•ฉ๋˜์–ด ์‹œ๋„ˆ์ง€๋ฅผ ๋‚ธ๋‹ค.

๋‹ค์–‘ํ•œ ์Šคํ† ๋ฆฌ์ง€ ์˜ต์…˜์„ ์ œ๊ณตํ•œ๋‹ค. HDFS๋Š” ๋น ๋ฅด๊ฒŒ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๊ณ  ์…”ํ”Œ๋งํ•  ๋•Œ ์‚ฌ์šฉ๋˜๋‚˜ ํด๋Ÿฌ์Šคํ„ฐ๊ฐ€ ์ข…๋ฃŒ๋˜๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ์‚ฌ๋ผ์ง€๋Š” ๋น„์˜๊ตฌ์  ์ €์žฅ์†Œ์ด๋‹ค. EMRFS๋Š” EMR์ด S3๋ฅผ ๊ธฐ๋ณธ ์Šคํ† ๋ฆฌ์ง€์ฒ˜๋Ÿผ ์‚ฌ์šฉํ•˜๊ฒŒ ํ•ด์ฃผ๋Š” ์ปค๋„ฅํ„ฐ์ด๋‹ค. ๋ฐ์ดํ„ฐ์˜ ์˜์†์„ฑ์„ ๋ณด์žฅํ•œ๋‹ค. EBS๋Š” EC2 ์ธ์Šคํ„ด์Šค์— ์—ฐ๊ฒฐํ•˜๋Š” ๋ธ”๋ก ์Šคํ† ๋ฆฌ์ง€์ด๋‹ค. ๋ณด๋‹ค ์œ ์—ฐํ•˜๊ฒŒ ์šฉ๋Ÿ‰์„ ์กฐ์ ˆํ•  ์ˆ˜ ์žˆ์œผ๋‚˜ EMR์—์„œ๋Š” ํด๋Ÿฌ์Šคํ„ฐ์™€ ์ƒ๋ช…์ฃผ๊ธฐ๋ฅผ ๊ณต์œ ํ•˜๋ฏ€๋กœ ๋ณดํ†ต S3๋ฅผ ๊ถŒ์žฅํ•œ๋‹ค.

This post is licensed under CC BY 4.0 by the author.