- ๊ฐ๋
- ๋นจ๊ฐ์ ๋ฐ์ค(30ํ ๊ธฐ์ถ๋ฌธ์ ๊ด๋ จ ๊ฐ๋ , ์ฃผ๊ด์)
- ํ๋์ ๋ฐ์ค(30ํ ๊ธฐ์ถ๋ฌธ์ ๊ด๋ จ ๊ฐ๋
, ๊ฐ๊ด์)
1. ๋ฐ์ดํฐ ๋ถ์ ๊ธฐํ์ ์ดํด
1_1. ๋ถ์ ๊ธฐํ ๋ฐฉํฅ์ฑ ๋์ถ
* ๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ 3๊ฐ์ง ์์ญ
1) ์ํ/ํต๊ณํ์ ์ง์
2) ์ ๋ณด ๊ธฐ์ (IT๊ธฐ์ , ํดํน๊ธฐ์ , ํต์ ๊ธฐ์ ๋ฑ)
3) ๋น์ฆ๋์ค
* ๋ถ์์ ๋์(What)๊ณผ ๋ถ์์ ๋ฐฉ๋ฒ(How)์ ๋ฐ๋ฅธ ๋ถ์ ์ ํ 4๊ฐ์ง
1) ์ต์ ํ(Optimization) What-known, How-known
2) ํต์ฐฐ(Insight) What-unknown, How-known
3) ํด๋ฒ(Solution) What-known, How-unknown
4) ๋ฐ๊ฒฌ(Discovery) What-unknown, How-unknown
* ๋ชฉํ ์์ ๋ณ ๋ถ์ ๊ธฐํ ๋ฐฉ์
1) ๊ณผ์ ์ค์ฌ์ ์ธ ์ ๊ทผ ๋ฐฉ์ : ๋น๋ฉดํ ๊ณผ์ ๋ฅผ ๋น ๋ฅด๊ฒ ํด๊ฒฐ
๋ชฉํ - Speed & Test, ๊ณผ์ ์ ํ - Quick-Win, ์ ๊ทผ๋ฐฉ์ - Problem Solving
2) ์ฅ๊ธฐ์ ์ธ ๋ง์คํฐํ๋ ๋ฐฉ์ : ์ง์์ ์ธ ๋ถ์ ๋ด์ฌํ
๋ชฉํ - Accuracy & Deploy, ๊ณผ์ ์ ํ - Long Term View, ์ ๊ทผ๋ฐฉ์ - Problem Definition
* ๋ถ์ ๊ธฐํ ์ ๊ณ ๋ ค์ฌํญ
1) ๊ฐ์ฉ ๋ฐ์ดํฐ(Available data)
2) ์ ์ฆ์ผ์ด์ค(Proper Business Use Case)
3) ์ฅ์ ์์(Low Barrier Of Execution)
4) ๋ณํ ๊ด๋ฆฌ(Change Management)
* ๋ฐ์ดํฐ ์ ํ
1) ์ ํ ๋ฐ์ดํฐ - ERP, CRM, SCM ๋ฑ ๋ฐ์ดํฐ ์์ฒด๋ก ๋ถ์์ด ๊ฐ๋ฅํ๋ฉด ๋ฐ์ด๋ฒํฐ๋ฒ ์ด์ค๋ก ๊ด๋ฆฌ
2) ๋ฐ์ ํ ๋ฐ์ดํฐ - ๋ก๊ทธ ๋ฐ์ดํฐ, ๋ชจ๋ฐ์ผ ๋ฐ์ดํฐ, ์ผ์ฑ ๋ฐ์ดํฐ ๋ฑ ๋ฐ์ดํฐ ์์ฒด๋ก ๋ถ์์ด ๊ฐ๋ฅํ์ง๋ง ํด์์ด ๋ถ๊ฐ๋ฅํ์ฌ ๋ฉํ์ ๋ณด๋ฅผ ํ์ฉํด์ผ ํด์์ด ๊ฐ๋ฅ
3) ๋น์ ํ ๋ฐ์ดํฐ - ์์, ์์ฑ, ๋ฌธ์ ๋ฑ ๋ฐ์ดํฐ ์์ฒด๋ก ๋ถ์์ด ๋ถ๊ฐ๋ฅํ์ฌ ๋ถ์ ๋ฐ์ดํฐ๋ก ๋ณ๊ฒฝ ํ ๋ถ์
1_2. ๋ถ์ ๋ฐฉ๋ฒ๋ก
* ๊ธฐ์
์ ํฉ๋ฆฌ์ ์์ฌ๊ฒฐ์ ์ ๊ฐ๋ก๋ง๋ ์ฅ์ ์์
1) ๊ณ ์ ๊ด๋
(Stereotype)
2) ํธํฅ๋ ์๊ฐ(Bias)
3) ํ๋ ์ด๋ฐ ํจ๊ณผ(Framing Effect : ๋ฌธ์ ์ ํํ ๋ฐฉ์์ ๋ฐ๋ผ ๋์ผํ ์ฌ๊ฑด์ด๋ ์ํฉ์์๋ ๋ถ๊ตฌํ๊ณ ๊ฐ์ธ์ ํ๋จ์ด๋ ์ ํ์ด ๋ฌ๋ผ์ง ์ ์๋ ํ์)
* ์๋ฌต์ง : ํ์ต๊ณผ ๊ฒฝํ์ ํตํด ๊ฐ์ธ์๊ฒ ์ฒดํ๋์ด ์์ง๋ง ๊ฒ์ผ๋ก ๋๋ฌ๋์ง ์๋ ์ง์ (์ํธ ์์ฉ : ๊ณตํตํ, ๋ด๋ฉดํ)
* ํ์์ง : ๋ฌธ์๋ ๋งค๋ด์ผ์ฒ๋ผ ํ์ํ๋ ์ง์ (์ํธ ์์ฉ : ํ์ถํ, ์ฐ๊ฒฐํ)
* ๋ฐฉ๋ฒ๋ก ์ ์์ฑ๊ณผ์
1) ๋ฐฉ๋ฒ๋ก -> ์๋ฌต์ง (๋ด์ฌํ)
2) ์๋ฌต์ง -> ํ์์ง (ํ์ํ)
3) ํ์์ง -> ๋ฐฉ๋ฒ๋ก (์ฒด๊ณํ)
* ๋ฐฉ๋ฒ๋ก ์ ์ ์ฉ ์
๋ฌด์ ํน์ฑ์ ๋ฐ๋ฅธ ๋ชจ๋ธ
1) ํญํฌ์ ๋ชจ๋ธ(Waterfall Model) : ๋จ๊ณ๋ฅผ ์์ฐจ์ ์ผ๋ก ์งํํ๋ ๋ฐฉ๋ฒ์ผ๋ก, ์ด์ ๋จ๊ณ๊ฐ ์๋ฃ๋์ด์ผ ๋ค์ ๋จ๊ณ๋ก ์งํ๋ ์ ์์ผ๋ฉฐ ๋ฌธ์ ๊ฐ ๋ฐ๊ฒฌ๋ ์ ํผ๋๋ฐฑ ๊ณผ์ ์ด ์ํ๋๋ค. (๊ธฐ์กด IT์ SW ๊ฐ๋ฐ ๋ฐฉ์)
2) ํ๋กํ ํ์
๋ชจ๋ธ(Prototype Model) : ํญํฌ์ ๋ชจ๋ธ์ ๋จ์ ์ ๋ณด์ํ๊ธฐ ์ํด ์ ์ง์ ์ผ๋ก ์์คํ
์ ๊ฐ๋ฐํด ๋๊ฐ๋ ์ ๊ทผ ๋ฐฉ์์ผ๋ก, ๊ณ ๊ฐ์ ์๊ตฌ๋ฅผ ์์ ํ๊ฒ ์ดํดํ๊ณ ์์ง ๋ชปํ๊ฑฐ๋ ์๋ฒฝํ ์๊ตฌ ๋ถ์์ ์ด๋ ค์์ ํด๊ฒฐํ๊ธฐ ์ํด ์ผ๋ถ๋ถ์ ์ฐ์ ๊ฐ๋ฐํ์ฌ ์ฌ์ฉ์์๊ฒ ์ ๊ณตํ๋ค. ์ํ ์ฌ์ฉ ํ ์ฌ์ฉ์์ ์๊ตฌ๋ฅผ ๋ถ์ํ๊ฑฐ๋ ์๊ตฌ ์ ๋น์ฑ์ ์ ๊ฑด, ์ฑ๋ฅ์ ํ๊ฐํ์ฌ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ํตํ ๊ฐ์ ์์
์ ์ํํ๋ ๋ชจ๋ธ์ด๋ค.
3) ๋์ ํ ๋ชจ๋ธ(Spiral Model) : ๋ฐ๋ณต์ ํตํด ์ ์ฆ์ ์ผ๋ก ๊ฐ๋ฐํ๋ ๋ฐฉ๋ฒ์ผ๋ก, ์ฒ์ ์๋ํ๋ ํ๋ก์ ํธ์ ์ ์ฉ์ด ์ฉํ์ง๋ง ๊ด๋ฆฌ ์ฒด๊ณ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๊ฐ์ถ์ง ๋ชปํ ๊ฒฝ์ฐ ๋ณต์ก๋๊ฐ ์์นํ์ฌ ํ๋ก์ ํธ ์งํ์ด ์ด๋ ค์ธ ์ ์๋ค.
* KDD ๋ถ์ ์ ์ฐจ
1) ๋ฐ์ดํฐ์
์ ํ (selection)
- ๋ฐ์ดํฐ์
์ ํ์ ์์ ๋ถ์ ๋์์ ๋น์ฆ๋์ค ๋๋ฉ์ธ์ ๋ํ ์ดํด์ ํ๋ก์ ํธ ๋ชฉํ ์ค์ ์ด ํ์์ด๋ฉฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋๋ ์์ ๋ฐ์ดํฐ์์ ๋ถ์์ ํ์ํ ๋ฐ์ดํฐ๋ฅผ ์ ํํ๋ ๋จ๊ณ์ด๋ค.
- ๋ฐ์ดํฐ๋ง์ด๋์ ํ์ํ ๋ชฉํ ๋ฐ์ดํฐ(target data)๋ฅผ ๊ตฌ์ฑํ์ฌ ๋ถ์์ ํ์ฉํ๋ค.
2) ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ (preprocessing)
- ์ถ์ถ๋ ๋ถ์ ๋์์ฉ ๋ฐ์ดํฐ ์
์ ํฌํจ๋์ด ์๋ ์ก์(Noise)๊ณผ ์ด์์น(Outlier), ๊ฒฐ์ธก์น(Missing Value)๋ฅผ ์๋ณํ๊ณ ํ์์ ์ ๊ฑฐํ๊ฑฐ๋ ์๋ฏธ์๋ ๋ฐ์ดํฐ๋ก ์ฌ์ฒ๋ฆฌํ์ฌ ๋ฐ์ดํฐ ์
์ ์ ์ ํ๋ ๋จ๊ณ์ด๋ค.
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋จ๊ณ์์ ์ถ๊ฐ๋ก ์๊ตฌ๋๋ ๋ฐ์ดํฐ ์
์ด ํ์ํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ ์ ํ ํ๋ก์ธ์ค๋ฅผ ์ฌ์คํํ๋ค.
3) ๋ฐ์ดํฐ ๋ณํ (transformation)
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ํตํด ์ ์ ๋ ๋ฐ์ดํฐ์ ๋ถ์ ๋ชฉ์ ์ ๋ง๊ฒ ๋ณ์๋ฅผ ์์ฑ, ์ ํํ๊ณ ๋ฐ์ดํฐ์ ์ฐจ์์ ์ถ์ํ์ฌ ํจ์จ์ ์ผ๋ก ๋ฐ์ดํฐ๋ง์ด๋์ ํ ์ ์๋๋ก ๋ฐ์ดํฐ์ ๋ณ๊ฒฝํ๋ ๋จ๊ณ์ด๋ค.
- ๋ฐ์ดํฐ๋ง์ด๋ ํ๋ก์ธ์ค๋ฅผ ์งํํ๊ธฐ ์ํด ํ์ต์ฉ ๋ฐ์ดํฐ(training data)์ ๊ฒ์ฆ์ฉ ๋ฐ์ดํฐ(test data)๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฆฌํ๋ ๋จ๊ณ์ด๋ค.
4) ํ
์ดํฐ ๋ง์ด๋ (data mining)
- ํ์ต์ฉ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ ๋ถ์๋ชฉ์ ์ ๋ง๋ ๋ฐ์ดํฐ๋ง์ด๋ ๊ธฐ๋ฒ์ ์ ํํ๊ณ , ์ ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ์ฌ ๋ฐ์ดํฐ๋ง์ด๋ ์์
์ ์คํํ๋ ๋จ๊ณ์ด๋ค.
- ํ์์ ๋ฐ๋ผ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ์ ๋ฐ์ดํฐ ๋ณํ ํ๋ก์ธ์ค๋ฅผ ์ถ๊ฐ๋ก ์คํํ์ฌ ์ต์ ์ ๊ฒฐ๊ณผ๋ฅผ ์ฐ์ถํ๋ค.
5) ๊ฒฐ๊ณผ ํ๊ฐ (interpretation / evaluation)
- ๋ฐ์ดํฐ๋ง์ด๋ ๊ฒฐ๊ณผ์ ๋ํ ํด์๊ณผ ํ๊ฐ, ๊ทธ๋ฆฌ๊ณ ๋ถ์ ๋ชฉ์ ๊ณผ์ ์ผ์น์ฑ์ ํ์ธํ๋ค.
- ๋ฐ์ดํฐ๋ง์ด๋์ ํตํด ๋ฐ๊ฒฌํ ์ง์์ ์
๋ฌด์ ํ์ฉํ๊ธฐ ์ํ ๋ฐฉ์ ๋ง๋ จ์ ๋จ๊ณ์ด๋ค.
- ํ์์ ๋ฐ๋ผ ๋ฐ์ดํฐ ์ ํ ํ๋ก์ธ์ค์์ ๋ฐ์ดํฐ๋ง์ด๋ ํ๋ก์ธ์ค๋ฅผ ๋ฐ๋ณต ์ํํ๋ค.
* CRISP-DM์ 4 ๋ ๋ฒจ ๊ตฌ์กฐ
- ์ต์์ ๋ ๋ฒจ์ ์ฌ๋ฌ ๊ฐ์ ๋จ๊ณ(Phases)๋ก ๊ตฌ์ฑ๋๊ณ ๊ฐ ๋จ๊ณ๋ ์ผ๋ฐํ ํ์คํฌ(Generic Tasks)๋ฅผ ํฌํจํ๋ค. ์ผ๋ฐํ ํ์คํฌ๋ ๋ฐ์ดํฐ ๋ง์ด๋์ ๋จ์ผ ํ๋ก์ธ์ค๋ฅผ ์์ ํ๊ฒ ์ํํ๋ ๋จ์์ด๋ฉฐ, ์ด๋ ๋ค์ ๊ตฌ์ฒด์ ์ธ ์ํ ๋ ๋ฒจ์ธ ์ธ๋ถํ ํ์คํฌ(Specialized Tasks)๋ก ๊ตฌ์ฑ๋๋ค.
- ์๋ฅผ ๋ค์ด ๋ฐ์ดํฐ ์ ์ (Data Cleansing)๋ผ๋ ์ผ๋ฐํ ํ์คํฌ๋ ๋ฒ์ฃผํ ๋ฐ์ดํฐ ์ ์ ์ ์ฐ์ํ ๋ฐ์ดํฐ ์ ์ ์ ๊ฐ์ ์ธ๋ถํ ํ์คํฌ๋ก ๊ตฌ์ฑ๋๋ค.
- ๋ง์ง๋ง ๋ ๋ฒจ์ธ ํ๋ก์ธ์ค ์คํ(process instances)์ ๋ฐ์ดํฐ ๋ง์ด๋์ ์ํ ๊ตฌ์ฒด์ ์ธ ์คํ์ ํฌํจํ๋ค.
* CRISP-DM์ ํ๋ก์ธ์ค 6๋จ๊ณ
1) ์
๋ฌด ์ดํด (Business Understanding)
- ๋น์ฆ๋์ค ๊ด์ ์์ ํ๋ก์ ํธ์ ๋ชฉ์ ๊ณผ ์๊ตฌ์ฌํญ์ ์ดํดํ๊ธฐ ์ํ ๋จ๊ณ
- ๋๋ฉ์ธ ์ง์์ ๋ฐ์ดํฐ ๋ถ์์ ์ํ ๋ฌธ์ ์ ์๋ก ๋ณ๊ฒฝํ๊ณ ์ด๊ธฐ ํ๋ก์ ํธ ๊ณํ์ ์๋ฆฝํ๋ ๋จ๊ณ
์ํ ์
๋ฌด) ์
๋ฌด ๋ชฉ์ ํ์
, ์ํฉ ํ์
, ๋ฐ์ดํฐ ๋ง์ด๋ ๋ชฉํ ์ค์ , ํ๋ก์ ํธ ๊ณํ ์๋ฆฝ
2) ๋ฐ์ดํฐ ์ดํด (data understanding)
- ๋ถ์์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ๋ฐ์ดํฐ ์์ฑ์ ์ดํดํ๊ธฐ ์ํ ๋จ๊ณ
- ๋ฐ์ดํฐ ํ์ง์ ๋ํ ๋ฌธ์ ์ ์ ์๋ณํ๊ณ ์จ๊ฒจ์ ธ ์๋ ์ธ์ฌ์ดํธ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋จ๊ณ
์ํ ์
๋ฌด) ์ด๊ธฐ ๋ฐ์ดํฐ ์์ง, ๋ฐ์ดํฐ ๊ธฐ์ ๋ถ์, ๋ฐ์ดํฐ ํ์, ๋ฐ์ดํฐ ํ์ง ํ์ธ
3) ๋ฐ์ดํฐ ์ค๋น (data preparation)
- ๋ถ์์ ์ํ์ฌ ์์ง๋ ๋ฐ์ดํฐ์์ ๋ถ์๊ธฐ๋ฒ์ ์ ํฉํ ๋ฐ์ดํฐ๋ฅผ ํธ์ฑํ๋ ๋จ๊ณ(๋ง์ ์๊ฐ์ด ์์ ๋ ์ ์์)
์ํ ์
๋ฌด) ๋ถ์์ฉ ๋ฐ์ดํฐ ์
์ ํ, ๋ฐ์ดํฐ ์ ์ , ๋ถ์์ฉ ๋ฐ์ดํฐ ์
ํธ์ฑ, ๋ฐ์ดํฐ ํตํฉ, ๋ฐ์ดํฐ ํฌ๋งทํ
4) ๋ชจ๋ธ๋ง (modeling)
- ๋ค์ํ ๋ชจ๋ธ๋ง ๊ธฐ๋ฒ๊ณผ ์๊ณ ๋ฆฌ์ฆ์ ์ ํํ๊ณ ๋ชจ๋ธ๋ง ๊ณผ์ ์์ ์ฌ์ฉ๋๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ต์ ํํด ๋๊ฐ๋ ๋จ๊ณ
- ๋ชจ๋ธ๋ง ๊ณผ์ ์์ ๋ฐ์ดํฐ ์
์ด ์ถ๊ฐ๋ก ํ์ํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ ์ค๋น ๋จ๊ณ๋ฅผ ๋ฐ๋ณต ์ํํ ์ ์์ผ๋ฉฐ, ๋ชจ๋ธ๋ง ๊ฒฐ๊ณผ๋ฅผ ํ
์คํธ์ฉ ๋ฐ์ดํฐ ์
์ผ๋ก ํ๊ฐํ์ฌ ๋ชจ๋ธ์ ๊ณผ์ ํฉ(Over-fitting) ๋ฌธ์ ๋ฅผ ํ์ธ
์ํ ์
๋ฌด) ๋ชจ๋ธ๋ง ๊ธฐ๋ฒ ์ ํ, ๋ชจ๋ธ ํ
์คํธ ๊ณํ ์ค๊ณ, ๋ชจ๋ธ ์์ฑ, ๋ชจ๋ธ ํ๊ฐ
5) ํ๊ฐ (evaluation)
- ๋ชจ๋ธ๋ง ๊ฒฐ๊ณผ๊ฐ ํ๋ก์ ํธ ๋ชฉ์ ์ ๋ถํฉํ๋์ง ํ๊ฐํ๋ ๋จ๊ณ๋ก ๋ฐ์ดํฐ๋ง์ด๋ ๊ฒฐ๊ณผ๋ฅผ ์ต์ข
์ ์ผ๋ก ์์ฉ ํ ๊ฒ์ธ์ง ํ๋ค
์ํ ์
๋ฌด) ๋ถ์๊ฒฐ๊ณผ ํ๊ฐ, ๋ชจ๋ธ๋ง ๊ณผ์ ํ๊ฐ, ๋ชจ๋ธ ์ ์ฉ์ฑ ํ๊ฐ
6) ์ ๊ฐ (deployment)
- ๋ชจ๋ธ๋ง๊ณผ ํ๊ฐ ๋จ๊ณ๋ฅผ ํตํ์ฌ ์์ฑ๋ ๋ชจ๋ธ์ ์ค ์
๋ฌด์ ์ ์ฉํ๊ธฐ ์ํ ๊ณํ์ ์๋ฆฝํ๋ ๋จ๊ณ
- ๋ชจ๋ํฐ๋ง๊ณผ ๋ชจ๋ธ์ ์ ์ง๋ณด์ ๊ณํ ๋ง๋ จ
- CRISP-DM์ ๋ง์ง๋ง ๋จ๊ณ, ํ๋ก์ ํธ ์ข
๋ฃ ๊ด๋ จ ํ๋ก์ธ์ค๋ฅผ ์ํํ์ฌ ํ๋ก์ ํธ ๋ง๋ฌด๋ฆฌ
์ํ ์
๋ฌด) ์ ๊ฐ ๊ณํ ์๋ฆฝ, ๋ชจ๋ํฐ๋ง๊ณผ ์ ์ง๋ณด์ ๊ณํ ์๋ฆฝ, ํ๋ก์ ํธ ์ข
๋ฃ๋ณด๊ณ ์ ์์ฑ, ํ๋ก์ ํธ ๋ฆฌ๋ทฐ
* ๋น
๋ฐ์ดํฐ ๋ถ์์ ๊ณ์ธต์ ํ๋ก์ธ์ค
1) ๋จ๊ณ(Phase) : ํ๋ก์ธ์ค ๊ทธ๋ฃน(Process Group)์ ํตํ์ฌ ์์ฑ๋ ๋จ๊ณ๋ณ ์ฐ์ถ๋ฌผ์ด ์์ฑ๋๋ค. ๊ฐ ๋จ๊ณ๋ ๊ธฐ์ค์ (Baseline)์ผ๋ก ์ค์ ๋์ด ๊ด๋ฆฌ๋์ด์ผ ํ๋ฉฐ, ๋ฒ์ ๊ด๋ฆฌ(Configuration Management) ๋ฑ์ ํตํ์ฌ ํต์ ๊ฐ ์ด๋ฃจ์ด์ ธ์ผ ํ๋ค.
2) ํ์คํฌ(Task) : ๊ฐ ๋จ๊ณ๋ ์ฌ๋ฌ ๊ฐ์ ํ์คํฌ(Task)๋ก ๊ตฌ์ฑ๋๋ค. ๊ฐ ํ์คํฌ๋ ๋จ๊ณ๋ฅผ ๊ตฌ์ฑํ๋ ๋จ์ ํ๋์ด๋ฉฐ, ๋ฌผ๋ฆฌ์ ๋๋ ๋
ผ๋ฆฌ์ ๋จ์๋ก ํ์ง ๊ฒํ ์ ํญ๋ชฉ์ด ๋ ์ ์๋ค.
3) ์คํ
(Step) : WBS(Work Breakdown Structure)์ ์ํฌ ํจํค์ง(Work Package)์ ํด๋น๋๊ณ ์
๋ ฅ ์๋ฃ(Input), ์ฒ๋ฆฌ ๋ฐ ๋๊ตฌ(Process&Tool), ์ถ๋ ฅ์๋ฃ(Output)๋ก ๊ตฌ์ฑ๋ ๋จ์ ํ๋ก์ธ์ค(Unit Process)์ด๋ค.
* ๋น
๋ฐ์ดํฐ ๋ถ์ ๋ฐฉ๋ฒ๋ก ์ 5๋จ๊ณ
1) ๋ถ์ ๊ธฐํ(Planning) : ๋น์ฆ๋์ค ๋๋ฉ์ธ๊ณผ ๋ฌธ์ ์ ์ ์ธ์ํ๊ณ ๋ถ์ ๊ณ ๋ฐ ํ๋ก์ ํธ ์ํ๊ณํ์ ์๋ฆฝํ๋๋จ๊ณ์ด๋ค.
2) ๋ฐ์ดํฐ ์ค๋น(Preparing) : ๋น์ฆ๋์ค ์๊ตฌ์ฌํญ๊ณผ ๋ฐ์ดํฐ ๋ถ์์ ํ์ํ ์์ฒ ๋ฐ์ดํฐ๋ฅผ ์ ์ํ๊ณ ์ค๋นํ๋ ๋จ๊ณ์ด๋ค.
3) ๋ฐ์ดํฐ ๋ถ์(Analyzing) : ์์ฒ ๋ฐ์ดํฐ๋ฅผ ๋ถ์์ฉ ๋ฐ์ดํฐ ์
์ผ๋ก ํธ์ฑํ๊ณ ๋ค์ํ ๋ถ์ ๊ธฐ๋ฒ๊ณผ ์๊ณ ๋ฆฌ์ฆ์ ์ด์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๋ ๋จ๊ณ์ด๋ค. ๋ถ์ ๋จ๊ณ๋ฅผ ์ํํ๋ ๊ณผ์ ์์ ์ถ๊ฐ์ ์ธ ๋ฐ์ดํฐ ํ๋ณด๊ฐ ํ์ํ ๊ฒฝ์ฐ ๋ฐ์ดํฐ ์ค๋น ๋จ๊ณ๋ก ํผ๋๋ฐฑ(Feedback)ํ์ฌ ๋ ๋จ๊ณ๋ฅผ ๋ฐ๋ณตํ์ฌ ์งํํ๋ค.
4) ์์คํ
๊ตฌํ(Developing) : ๋ถ์ ๊ธฐํ์ ๋ง๋ ๋ชจ๋ธ์ ๋์ถํ๊ณ ์ด๋ฅผ ์ด์์ค์ธ ๊ฐ๋ ์์คํ
์ ์ ์ฉํ๊ฑฐ๋ ์์คํ
๊ฐ๋ฐ์ ์ํ ์ฌ์ ๊ฒ์ฆ์ผ๋ก ํ๋กํ ํ์
์์คํ
์ ๊ตฌํํ๋ค.
5) ํ๊ฐ ๋ฐ ์ ๊ฐ(Lesson Learned) : ๋ฐ์ดํฐ ๋ถ์ ๋ฐ ์์คํ
๊ตฌํ ๋จ๊ณ๋ฅผ ์ํํ ํ, ํ๋ก์ ํธ์ ์ฑ๊ณผ๋ฅผ ํ๊ฐํ๊ณ ์ ๋ฆฌํ๊ฑฐ๋ ๋ชจ๋ธ์ ๋ฐ์ ๊ณํ์ ์๋ฆฝํ์ฌ ์ฐจ๊ธฐ ๋ถ์ ๊ธฐํ์ผ๋ก ์ ๋ฌํ๊ณ ํ๋ก์ ํธ๋ฅผ ์ข
๋ฃํ๋ ๋จ๊ณ์ด๋ค.
1_3. ๋ถ์ ๊ณผ์ ๋ฐ๊ตด
* ํํฅ์ ์ ๊ทผ๋ฒ (Top Down Approach)
- ํํฉ ๋ถ์์ ํตํด ๊ธฐํ๋ ๋ฌธ์ ๋ฅผ ํ์(Problem Discovery)ํ๊ณ , ํด๋น ๋ฌธ์ ๋ฅผ ์ ์(Problem Definition), ํด๊ฒฐ๋ฐฉ์์ ํ์(Solution Search)ํ๋ค. ๊ทธ๋ฆฌ๊ณ ๋ฐ์ดํฐ ๋ถ์์ ํ๋น์ฑ ๊ฒํ (Feasibility Study)๋ฅผ ๊ฑฐ์ณ ๋ถ์ ๊ณผ์ ๋ฅผ ๋์ถํ๋ ๊ณผ์ ์ผ๋ก ๊ตฌ์ฑ๋๋ค.
* ํํฅ์ ์ ๊ทผ๋ฒ์ ๋ฐ์ดํฐ ๋ถ์ ๊ธฐํ ๋จ๊ณ
1) ๋ฌธ์ ํ์ (Problem Discovery)
- ์ ์ฒด์ ์ธ ๊ด์ ์ ๊ธฐ์ค ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋น ์ง์์ด ๋ฌธ์ ๋ฅผ ๋์ถํ๊ณ ์๋ณํ๋ ๊ฒ์ด ์ค์ํ๋ค.
- ์ ์ฒด์ ์ธ ๊ด์ ์ ๊ธฐ์ค ๋ชจ๋ธ๋ก๋ ๊ธฐ์
๋ดใฎ์ธ๋ถ ํ๊ฒฝ์ ํฌ๊ดํ๋ ๋น์ฆ๋์ค ๋ชจ๋ธ๊ณผ ์ธ๋ถ ์ฐธ์กฐ ๋ชจ๋ธ์ด ์กด์ฌํ๋ค.
- ๊ณผ์ ๋ฐ๊ตด ๋จ๊ณ์์๋ ์ธ๋ถ์ ์ธ ๊ตฌํ ๋ฐ ์๋ฃจ์
์ ์ด์ ์ ๋ง์ถ๋๊ฒ ์๋๋ผ, ๋ฌธ์ ๋ฅผ ํด๊ฒฐํจ์ผ๋ก์จ ๋ฐ์ํ๋๊ฐ์น์ ์ค์ ์ ๋๋ ๊ฒ์ด ์ค์ํ๋ค.
2) ๋ฌธ์ ์ ์ (Problem Definition)
- ์๋ณ๋ ๋น์ฆ๋์ค ๋ฌธ์ ๋ฅผ ๋ฐ์ดํฐ์ ๋ฌธ์ ๋ก ๋ณํํ์ฌ ์ ์ ํ๋ ๋จ๊ณ์ด๋ฉฐ, ์์ ์ํํ ๋ฌธ์ ํ์์ ๋จ๊ณ๊ฐ ๋ฌด์์(What) ์ด๋ค ๋ชฉ์ ์ผ๋ก(Why) ์ํํด์ผ ํ๋์ง์ ๋ํ ๊ด์ ์ด์๋ค๋ฉด, ๋ณธ ๋จ๊ณ์์๋ ์ด๋ฅผ ๋ฌ์ฑํ๊ธฐ ์ํด์ ํ์ํ ๋ฐ์ดํฐ ๋ฐ ๊ธฐ๋ฒ(How)์ ์ ์ํ๊ธฐ ์ํ ๋ฐ์ดํฐ ๋ถ์์ ๋ฌธ์ ๋ก์ ๋ณํ์ ์ํํ๊ฒ ๋๋ค.
- ๋ฐ์ดํฐ ๋ถ์ ๋ฌธ์ ์ ์ ์ ๋ฐ ์๊ตฌ์ฌํญ : ๋ถ์์ ์ํํ๋ ๋น์ฌ์๋ฟ๋ง ์๋๋ผ ํด๋น ๋ฌธ์ ๊ฐ ํด๊ฒฐ๋์์ ๋ ํจ์ฉ์ ์ป์ ์ ์๋ ์ต์ข
์ฌ์ฉ์(End User) ๊ด์ ์์ ์ด๋ฃจ์ด์ ธ์ผ ํ๋ค.
- ๋ฐ์ดํฐ ๋ถ์ ๋ฌธ์ ๊ฐ ์ ์ ์๋์์ ๋ ํ์ํ ๋ฐ์ดํฐ์ ์ ์ ๋ฐ ๊ธฐ๋ฒ ๋ฐ๊ตด์ด ์ฉ์ดํ๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฅํ ์ ํํ๊ฒ ๋ถ์์ ๊ด์ ์ผ๋ก ๋ฌธ์ ๋ฅผ ์ฌ์ ์ํ ํ์๊ฐ ์๋ค.
3) ํด๊ฒฐ๋ฐฉ์ ํ์(Solution Search)
- ์ ์๋ ๋ฐ์ดํฐ ๋ถ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ๋ค์ํ ๋ฐฉ์์ด ๋ชจ์๋๋ค.
4) ํ๋น์ฑ ๊ฒํ (Feasibility Study)
- ๋์ถ๋ ๋ถ์ ๋ฌธ์ ๋ ๊ฐ์ค์ ๋ํ ๋์์ ๊ณผ์ ํํ๊ธฐ ์ํด์๋ ๊ฒฝ์ ์ ํ๋น์ฑ, ๋ฐ์ดํฐ ๋ฐ ๊ธฐ์ ์ ํ๋น์ฑ ๊ฐ์ ๋ค๊ฐ์ ์ธ ํ๋น ์ฑ๋ถ์์ด ์ํ๋์ด์ผ ํ๋ค.
* ๋น์ฆ๋์ค ๋ชจ๋ธ ์บ๋ฒ์ค๋ฅผ ํ์ฉํ ๊ณผ์ ๋ฐ๊ตด ๋ฐฉ๋ฒ 5๊ฐ์ง ์์ญ
1) ์
๋ฌด(Operation) : ์ ํ ๋ฐ ์๋น์ค๋ฅผ ์์ฐํ๊ธฐ ์ํด์ ์ด์ํ๋ ๋ด๋ถ ํ๋ก์ธ์ค ๋ฐ ์ฃผ์ ์์(Resource) ๊ด๋ จ ์ฃผ์ ๋์ถ ์) ์์ฐ ๊ณต์ ์ต์ ํ, ์ฌ๊ณ ๋ ์ต์ํ
2) ์ ํ(Product) : ์์ ๋ฐ ์ ๊ณตํ๋ ์ ํใฎ์๋น์ค๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํ ๊ด๋ จ ์ฃผ์ ๋์ถ ์) ์ ํ์ ์ฃผ์๊ธฐ๋ฅ ๊ฐ์ , ์๋น์ค ๋ชจ๋ํฐ๋ง ์งํ๋์ถ
3) ๊ณ ๊ฐ(Customer) : ์ ํใฎ์๋น์ค๋ฅผ ์ ๊ณต๋ฐ๋ ์ฌ์ฉ์ ๋ฐ ๊ณ ๊ฐ, ์ด๋ฅผ ์ ๊ณตํ๋ ์ฑ๋์ ๊ด์ ์์ ๊ด๋ จ ์ฃผ์ ๋์ถ ์) ๊ณ ๊ฐ Call ๋๊ธฐ ์๊ฐ ์ต์ํ, ์์
์ ์์น ์ต์ ํ
4) ๊ท์ ์ ๊ฐ์ฌ(Regulation& Audit) : ์ ํ ์์ฐ ๋ฐ ์ ๋ฌ ๊ณผ์ ํ๋ก์ธ์ค ์ค์์ ๋ฐ์ํ๋ ๊ท์ ๋ฐ ๋ณด์์ ๊ด์ ์์ ์ฃผ์ ๋์ถ ์) ์ ๊ณต ์๋น์ค ํ์ง์ ์ด์ ์งํ ๊ด๋ฆฌ, ์๋ก์ด ํ๊ฒฝ ๊ท์ ์ ์์๋๋ ์ ํ ์ถ์ถ ๋ฑ
5) ์ง์ ์ธํ๋ผ(IT&Human Resource) : ๋ถ์์ ์ํํ๋ ์์คํ
์์ญ ๋ฐ ์ด๋ฅผ ์ด์ใฎ๊ด๋ฆฌํ๋ ์ธ๋ ฅ์ ๊ด์ ์์ ์ฃผ์ ๋์ถ ์) EDW ์ต์ ํ, ์ ์ ์ด์ ์ธ๋ ฅ ๋์ถ ๋ฑ
* ๋ถ์ ๊ธฐํ ๋ฐ๊ตด์ ๋ฒ์ ํ์ฅ ์ 4๊ฐ์ง ๊ด์
1) ๊ฑฐ์์ ๊ด์ ์ ๋ฉ๊ฐํธ๋ํธ : ์กฐ์ง ๋ฐ ํด๋น ์ฐ์
์ ํญ๋๊ฒ ์ํฅ์ ๋ฏธ์น๋ ์ฌํใฎ๊ฒฝ์ ์ ์ฉ์ธ์ STEEP์ผ๋ก ์์ฝ๋๋ ์ฌํ(Social), ๊ธฐ์ (Technological), ๊ฒฝ์ (Economic), ํ๊ฒฝ(Environmental), ์ ์น(Political) ์์ญ์ผ๋ก ํญ๋๊ฒ ๋๋๋ค.
2) ๊ฒฝ์์ ํ๋ ๊ด์ : ํ์ฌ ์ํํ๊ณ ์๋ ์ฌ์
์์ญ์ ์ง์ ๊ฒฝ์์ฌ ๋ฐ ์ ํใฎ์๋น์ค๋ฟ๋ง ์๋๋ผ ๋์ฒด์ฌ์ ์ ๊ท ์ง์
์ ๋ฑ์ผ๋ก ๊ด์ ์ ํ๋ํ์ฌ ์ํ์ด ๋ ์ ์๋ ์ํฉ์ ๋ํ ๋ถ์ ๊ธฐํ ๋ถ๊ตด์ ํญ์ ๋ํ์ ํ์ํ๋ค.
3) ์์ฅ์ ๋์ฆ ํ์ ๊ด์ : ํ์ฌ ์ํํ๊ณ ์๋ ์ฌ์
์์์ ์ง์ ๊ณ ๊ฐ๋ฟ๋ง ์๋๋ผ ๊ณ ๊ฐ๊ณผ ์ ์ดํ๋ ์ญํ ์ ์ํํ๋ ์ฑ๋(Channel) ๋ฐ ๊ณ ๊ฐ์ ๊ตฌ๋งค์ ์์ฌ๊ฒฐ์ ์ ์ํฅ์ ๋ฏธ์น๋ ์ํฅ์๋ค(Influencer)์ ๋ํ ํญ๋์ ๊ด์ ์ ๋ฐํ์ผ๋ก ๋ถ์ ๊ธฐํ๋ฅผ ํ์ํ๋ค.
4) ์ญ๋์ ์ฌํด์ ๊ด์ : ํ์ฌ ํด๋น ์กฐ์ง ๋ฐ ๊ธฐ์
์ด ๋ณด์ ํ ์ญ๋๋ฟ๋ง ์๋๋ผ ํด๋น ์กฐ์ง์ ๋น์ฆ๋์ค์ ์ํฅ์ ๋ผ์น๋ ํํธ๋ ๋คํธ์ํฌ๋ฅผ ํฌํจํ ํ์ฉ ๊ฐ๋ฅํ ์ญ๋์ ํ ๋๋ก ํญ๋์ ๋ถ์ ๊ธฐํ๋ฅผ ํ์ํ๋ค.
* ์ํฅ์ ์ ๊ทผ๋ฒ (Bottom Up Approach)
- ๊ธฐ์
์ด ๋ณด์ ํ๊ณ ์๋ ๋ค์ํ ์์ฒ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ถ์์ ํตํ์ฌ ํต์ฐฐ๋ ฅ๊ณผ ์ง์์ ์ป๋ ์ ๊ทผ ๋ฐฉ๋ฒ
- ๋ค์ํ ์์ฒ ๋ฐ์ดํฐ๋ฅผ ๋์์ผ๋ก ๋ถ์์ ์ํํ์ฌ ๊ฐ์น ์๋ ๋ชจ๋ ๋ฌธ์ ๋ฅผ ๋์ถํ๋ ์ผ๋ จ์ ๊ณผ์
* ์ํฅ์ ์ ๊ทผ๋ฒ์ ํน์ง
- ํํฅ์ ์ ๊ทผ๋ฒ์ ๋
ผ๋ฆฌ์ ๋จ๊ณ๋ณ ์ ๊ทผ๋ฒ์ผ๋ก ์ต๊ทผ์ ๋ณต์กํ๊ณ ๋ค์ํ ํ๊ฒฝ์์ ๋ฐ์ํ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ด๋ ต๊ธฐ ๋๋ฌธ์ ๋์์ธ์ ์ฌ๊ณ (Design Thinking) ์ ๊ทผ๋ฒ์ ํตํด WHY -> WHAT ๊ด์ ์ผ๋ก ์กด์ฌํ๋ ๋ฐ์ดํฐ ๊ทธ ์์ฒด๋ฅผ ๊ฐ๊ด์ ์ผ๋ก ๊ด์ฐฐํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ ์ ๊ทผ๋ฒ์ ์ฌ์ฉ
- ์ํฅ์ ์ ๊ทผ๋ฒ์ ๋น์ง๋ ํ์ต ๋ฐฉ๋ฒ(Unsupervised Learning)์ผ๋ก ์ํ๋๋ฉฐ, ๋ฐ์ดํฐ ์์ฒด์ ๊ฒฐํฉ, ์ฐ๊ด์ฑ, ์ ์ฌ์ฑ์ ์ค์ฌ์ผ๋ก ์ ๊ทผ
- ์ํ์ฐฉ์ค๋ฅผ ํตํ ๋ฌธ์ ํด๊ฒฐ, ํ๋กํ ํ์ดํ ์ ๊ทผ๋ฒ
* ๋น์ง๋ ํ์ต(Unsupervised Learning)
- ์ผ๋ฐ์ ์ผ๋ก ์ํฅ์ ์ ๊ทผ๋ฒ์ ๋ฐ์ดํฐ ๋ถ์์ ๋น์ง๋ ํ์ต ๋ฐฉ๋ฒ์ ์ํด ์ํ๋๋ค.
- ๋น์ง๋ ํ์ต์ ๋ฐ์ดํฐ ๋ถ์์ ๋ชฉ์ ์ด ๋ช
ํํ ์ ์๋ ํํ์ ํน์ ํ๋์ ๊ฐ์ ๊ตฌํ๋ ๊ฒ์ด ์๋๋ผ ๋ฐ์ดํฐ ์์ฒด์ ๊ฒฐํฉ, ์ฐ๊ด์ฑ, ์ ์ฌ์ฑ ๋ฑ์ ์ค์ฌ์ผ๋ก ๋ฐ์ดํฐ์ ์ํ๋ฅผ ํํํ๋ ๊ฒ์ด๋ค.
- ๋น์ง๋ ํ์ต์ ๋ฐ์ดํฐ ๋ง์ด๋ ๊ธฐ๋ฒ์ ์ - ์ฅ๋ฐ๊ตฌ๋ ๋ถ์, ๊ตฐ์ง ๋ถ์, ๊ธฐ์ ํต๊ณ ๋ฐ ํ๋ก ํ์ผ๋ง ๋ฑ
* ์ง๋ ํ์ต(Supervised Learning)
- ๋ช
ํํ ๋ชฉ์ ํ์ ๋ฐ์ดํฐ ๋ถ์์ ์ค์ํ๋ ๊ฒ์ ์ง๋ ํ์ต์ด๋ผ๊ณ ํ๋ฉฐ, ๋ถ๋ฅ, ์ถ์ธก, ์์ธก, ์ต์ ํ๋ฅผ ํตํด ์ฌ์ฉ์์ ์ฃผ๋ํ์ ๋ถ์์ ์ค์ํ๊ณ ์ง์์ ๋์ถํ๋ ๊ฒ์ด ๋ชฉ์ ์ด๋ค.
* ํ๋กํ ํ์ดํ ์ ๊ทผ๋ฒ
- ์ฌ์ฉ์๊ฐ ์๊ตฌ์ฌํญ์ด๋ ๋ฐ์ดํฐ๋ฅผ ์ ํํ ๊ท์ ํ๊ธฐ ์ด๋ ต๊ณ ๋ฐ์ดํฐ ์์ค๋ ๋ช
ํํ ํ์
ํ๊ธฐ ์ด๋ ค์ด ์ํฉ์์ ์ผ๋จ ๋ถ์์ ์๋ํด ๋ณด๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํด ๊ฐ๋ฉด์ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํด ๋๊ฐ๋ ๋ฐฉ๋ฒ์ ๋งํ๋ค.
- ํํฅ์ ์ ๊ทผ๋ฐฉ์์ ๋ฌธ์ ๊ฐ ์ ํํ๋์ด ์๊ณ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ๋ฐ์ดํฐ๊ฐ ์๋ฒฝํ๊ฒ ์กฐ์ง์ ์กด์ฌํ ๊ฒฝ์ฐ์ ํจ๊ณผ์ ์ด๊ณ ํ๋กํ ํ์ดํ ๋ฐฉ๋ฒ๋ก ์ ๋น๋ก ์์ ํ์ง๋ ๋ชปํ๋ค ํด๋ ์ ์ํ๊ฒ ํด๊ฒฐ์ฑ
์ด๋ ๋ชจํ์ ์ ์ํจ์ผ๋ก์จ, ์ด๋ฅผ ๋ฐํ์ผ๋ก ๋ฌธ์ ๋ฅผ ์ข ๋ ๋ช
ํํ๊ฒ ์ธ์ํ๊ณ ํ์ํ ๋ฐ์ดํฐ๋ฅผ ์๋ณํ์ฌ ๊ตฌ์ฒดํํ ์ ์๊ฒ ํ๋ ์ ์ฉํ ์ํฅ์ ์ ๊ทผ ๋ฐฉ์์ด๋ค.
- ํ๋กํ ํ์ดํ ์ ๊ทผ๋ฒ์ ๊ธฐ๋ณธ์ ์ธ ํ๋ก์ธ์ค๋ ๊ฐ์ค์ ์์ฑ, ๋์์ธ์ ๋ํ ์คํ, ์ค์ ํ๊ฒฝ์์์ ํ
์คํธ, ํ
์คํธ ๊ฒฐ๊ณผ์์์ ํต์ฐฐ๋์ถ ๋ฐ ๊ฐ์ค ํ์ธ์ผ๋ก ๊ตฌ์ฑ๋๋ค.
1_4. ๋ถ์ ํ๋ก์ ํธ ๊ด๋ฆฌ ๋ฐฉ์
* ๋ถ์๊ณผ์ ๊ด๋ฆฌ๋ฅผ ์ํ 5๊ฐ์ง ์์ญ
1) ๋ฐ์ดํฐ ํฌ๊ธฐ(Data Size)
- ๋ถ์ํ๊ณ ์ ํ๋ ๋ฐ์ดํฐ์ ์์ ๊ณ ๋ คํ ๊ด๋ฆฌ ๋ฐฉ์ ์๋ฆฝ์ด ํ์ํ๋ค. ํ๋ก ํ๊ฒฝ์์์ ์์ฒญ๋ ๋ฐ์ดํฐ์์ ๊ธฐ๋ฐ์ผ๋ก ๋ถ์ํ๋ ๊ฒ๊ณผ ๊ธฐ์กด ์ ํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์๋ ์๊ฐ ๋น ์์ฑ๋๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ ๋์ ๊ด๋ฆฌ๋ฐฉ์์ ์ฐจ์ด๊ฐ ๋ ์ ๋ฐ์ ์๋ค.
2) ๋ฐ์ดํฐ ๋ณต์ก์ฑ(Data Complexity)
- BI(Business Intelligence) ํ๋ก์ ํธ์ฒ๋ผ ์ ํ ๋ฐ์ดํฐ๊ฐ ๋ถ์ ๋งํธ๋ก ๊ตฌ์ฑ๋์ด ์๋ ์ํ์์ ๋ถ์์ ํ๋ ๊ฒ๊ณผ ๋ฌ๋ฆฌ ํ
์คํธ, ์ค๋์ค, ๋น๋์ค ๋ฑ์ ๋น์ ํ ๋ฐ์ดํฐ ๋ฐ ๋ค์ํ ์์คํ
์ ์ฐ์ฌ๋์ด ์๋ ์์ฒ ๋ฐ์ดํฐ๋ค์ ํตํฉํด์ ๋ถ์ ํ๋ก์ ํธ๋ฅผ ์งํ ํ ๋๋, ์ด๊ธฐ ๋ฐ์ดํฐ์ ํ๋ณด์ ํตํฉ ๋ฟ ์๋๋ผ ํด๋น ๋ฐ์ดํฐ์ ์ ์ ์ฉ๋ ์ ์๋ ๋ถ์ ๋ชจ๋ธ์ ์ ์ ๋ฑ์ ๋ํ ์ฌ์ ๊ณ ๋ ค๊ฐ ํ์ํ๋ค.
3) ์๋(Speed)
- ๋ถ์๊ฒฐ๊ณผ๊ฐ ๋์ถ๋์์ ๋ ์ด๋ฅผ ํ์ฉํ๋ ์๋๋ฆฌ์ค ์ธก๋ฉด์์์ ์๋๋ฅผ ๊ณ ๋ คํด์ผ ํ๋ค. ์ผ ๋จ์, ์ฃผ ๋จ์ ์ค์ ์ ๊ฒฝ์ฐ์๋ ๋ฐฐ์น(Batch)ํํ๋ก ์์
๋์ด๋ ๋ฌด๋ฐฉํ์ง๋ง ์ค์๊ฐ์ผ๋ก ์ฌ๊ธฐ(Fraud)๋ฅผ ํ์งํ๊ฑฐ๋ ๊ณ ๊ฐ์๊ฒ ๊ฐ์ธํ๋ ์ํใฎ์๋น์ค๋ฅผ ์ถ์ฒํ๋ ๊ฒฝ์ฐ์๋ ๋ถ์ ๋ชจ๋ธ์ ์ ์ฉ ๋ฐ ๊ณ์ฐ์ด ์ค์๊ฐ์ผ๋ก ์ํ๋์ด์ผํ๊ธฐ ๋๋ฌธ์ ํ๋ก์ ํธ ์ํ ์ ๋ถ์ ๋ชจ๋ธ์ ์ฑ๋ฅ ๋ฐ ์๋๋ฅผ ๊ณ ๋ คํ ๊ฐ๋ฐ ๋ฐ ํ
์คํธ๊ฐ ์ํ๋์ด์ผํ๋ค.
4) ๋ถ์ ๋ณต์ก์ฑ(Analytic Complexity)
- ๋ถ์ ๋ชจ๋ธ์ ์ ํ๋์ ๋ณต์ก๋๋ ํธ๋ ์ด๋์คํ(Trade off)๊ด๊ณ๊ฐ ์กด์ฌํ๋ค. ๋ถ์ ๋ชจ๋ธ์ด ๋ณต์กํ ์๋ก ์ ํ๋๋ ์ฌ๋ผ๊ฐ์ง๋ง ํด์์ด ์ด๋ ค์์ง๋ ๋จ์ ์ด ์กด์ฌํ๋ฏ๋ก ์ด์ ๋ํ ๊ธฐ์ค์ ์ ์ฌ์ ์ ์ ์ํด ๋์ด์ผ ํ๋ค. ๊ณ ๊ฐ์ ์ ์ฉ์ ํ๊ฐํ๋ ๋ง์ผํ
์๋๋ฆฌ์ค์์ ๋ถ์๋ชจ๋ธ์ ํ์ฉํ์ฌ ์ ์ฉ์ ์๊ฐ ๋ฎ๊ฒ ๋์ฌ ๋ ์ด๋ ํ ๋ณ์์ ๊ธฐ์ํ๋์ง๋ฅผ ๋ชจ๋ธ์์ ์ค๋ช
ํด ์ค ์ ์์ผ๋ฉด ์์
ใฎ๋ง์ผํ
์ง์ ์
์ฅ์์๋ ํด๋น ๊ณ ๊ฐ๊ณผ์ ์ํต์ด ์ด๋ ค์์ง๋ ๋จ์ ์ด ์กด์ฌํ๋ฏ๋ก, ํด์์ด ๊ฐ๋ฅํ๋ฉด์๋ ์ ํ๋๋ฅผ ์ฌ๋ฆด ์ ์๋ ์ต์ ๋ชจ๋ธ์ ์ฐพ๋ ๋ฐฉ์์ ์ฌ์ ์ ๋ชจ์ํด์ผ ํ๋ค.
5) ์ ํ๋์ ์ ๋ฐ๋ (Accuracy & Precision)
- Accuracy๋ ๋ชจ๋ธ๊ณผ ์ค์ ๊ฐ ์ฌ์ด์ ์ฐจ์ด๊ฐ ์ ๋ค๋ ์ ํ๋๋ฅผ ์๋ฏธํ๊ณ Precision์ ๋ชจ๋ธ์ ์ง์์ ์ผ๋ก ๋ฐ๋ณตํ์ ๋์ ํธ์ฐจ์ ์์ค์ผ๋ก์จ ์ผ๊ด์ ์ผ๋ก ๋์ผํ ๊ฒฐ๊ณผ๋ฅผ ์ ์ํ๋ค๋ ๊ฒ์ ์๋ฏธํ๋ค. ๋ถ์์ ํ์ฉ์ ์ธ ์ธก๋ฉด์์๋ Accuracy๊ฐ ์ค์ํ๋ฉฐ, ์์ ์ฑ ์ธก๋ฉด์์๋ Precision์ด ์ค์ํ๋ค. ๊ทธ๋ฌ๋ Accuracy์ Precision์ ํธ๋ ์ด๋์คํ๊ฐ ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ์ ํด์ ๋ฐ ์ ์ฉ ์ ์ฌ์ ์ ๊ณ ๋ คํด์ผ ํ๋ค.
2. ๋ถ์ ๋ง์คํฐ ํ๋
2_1. ๋ง์คํฐ ํ๋ ์๋ฆฝ ํ๋ ์ ์ํฌ
* ISP(Information Strategy Planning)
- ์ ๋ณด๊ธฐ์ ๋๋ ์ ๋ณด์์คํ
์ ์ ๋ต์ ์ผ๋ก ํ์ฉํ๊ธฐ ์ํ์ฌ ์กฐ์ง ๋ดใฎ์ธ๋ถ ํ๊ฒฝ์ ๋ถ์ํ์ฌ ๊ธฐํ๋ ๋ฌธ์ ์ ์ ๋์ถํ๊ณ ์ฌ์ฉ์์ ์๊ตฌ์ฌํญ์ ๋ถ์ํ์ฌ ์์คํ
๊ตฌ์ถ ์ฐ์ ์์๋ฅผ ๊ฒฐ์ ํ๋ ๋ฑ ์ค์ฅ๊ธฐ ๋ง์คํฐ ํ๋์ ์๋ฆฝํ๋ ์ ์ฐจ์ด๋ค.
* ๋ถ์ ๋ง์คํฐ ํ๋
- ์ผ๋ฐ์ ์ธ ISP ๋ฐฉ๋ฒ๋ก ์ ํ์ฉํ๋ ๋ฐ์ดํฐ ๋ถ์ ๊ธฐํ์ ํน์ฑ์ ๊ณ ๋ คํ์ฌ ์ํํ๊ณ ๊ธฐ์
์์ ํ์ํ ๋ฐ์ดํฐ ๋ถ์ ๊ณผ์ ๋ฅผ ๋น ์ง์์ด ๋์ถํ ํ ๊ณผ์ ์ ์ฐ์ ์์๋ฅผ ๊ฒฐ์ ํ๊ณ ๋จ๊ธฐ ๋ฐ ์คใฎ์ฅ๊ธฐ๋ก ๋๋์ด ๊ณํ์ ์๋ฆฝํ๋ค.
* ๊ณผ์ ์ฐ์ ์์ ํ๊ฐ๊ธฐ์ค
1) ์ ๋ต์ ์ค์๋
์ ๋ต์ ํ์์ฑ : ์ ๋ต์ ๋ชฉํ ๋ฐ ๋ณธ์์ ์
๋ฌด์ ์ง์ ์ ์ธ ์ฐ๊ด๊ด๊ณ๊ฐ ๋ฐ์ ํ ์ ๋, ์ด์ ๋ฏธํด๊ฒฐ์ ๋ฐ์ํ๊ฒ ๋ ์ํ ๋ฐ ์์ค์ ๋ํ ์ ๋
์๊ธ์ฑ : ์ฌ์ฉ์ ์๊ตฌ์ฌํญ, ์
๋ฌด๋ฅ๋ฅ ํฅ์์ ์ํด ์๊ธํ ์ํ๋์ด์ผ ํ๋์ง์ ๋ํ ์ ๋, ํฅํ ๊ฒฝ์์ฐ์ ํ๋ณด๋ฅผ ์ํ ์ค์์ฑ ์ ๋
2) ์คํ ์ฉ์ด์ฑ
ํฌ์ ์ฉ์ด์ฑ : ๊ธฐ๊ฐ ๋ฐ ์ธ๋ ฅ ํฌ์
์ฉ์ด์ฑ ์ ๋, ๋น์ฉ ๋ฐ ํฌ์์์ฐ ํ๋ณด ๊ฐ๋ฅ์ฑ ์ ๋
๊ธฐ์ ์ฉ์ด์ฑ : ์ ์ฉ ๊ธฐ์ ์ ์์ ์ฑ ๊ฒ์ฆ ์ ๋, ์์ฉ์์คํ
, H/W ์ ์ง๋ณด์ ์ฉ์ด์ฑ ์ ๋, ๊ฐ๋ฐ ์คํฌ ์ฑ์๋ ๋ฐ ์ ๊ธฐ์ ์ ์ฉ์ฑ ์ ๋
* ROI ๊ด์ ์์ ๋น
๋ฐ์ดํฐ์ ํต์ฌ ํน์ง
1) ํฌ์๋น์ฉ(Investment) ์์
ํฌ๊ธฐ(Volume)
- ๋ฐ์ดํฐ์ ๊ท๋ชจ ๋ฐ ์์ ์๋ฏธ, ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅใฎ์ฒ๋ฆฌํ๊ณ ๊ด๋ฆฌํ๊ธฐ ์ํด์๋ ์๋ก์ด ํฌ์๊ฐ ํ์ํ๋ค.
๋ค์์ฑ(Variety)
- ๋ค์ํ ์ข
๋ฅ์ ํํ๋ฅผ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์
์ํ๋๋ฐ ์์ด ํฌ์๊ฐ ํ์ํ๋ค.
์๋(Velocity)
- ๋ฐ์ดํฐ ์์ฑ ์๋ ๋ฐ ์ฒ๋ฆฌ์๋๋ฅผ ๋น ๋ฅด๊ฒ ๊ฐ๊ณตใฎ๋ถ์ํ๋ ๊ธฐ์ ์ด ์๊ตฌ๋๋ค.
2) ๋น์ฆ๋์ค ํจ๊ณผ(Return) ์์
๊ฐ์น(Value)
- ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ํ์ฉํ๊ฑฐ๋ ์ค์ง์ ์ธ ์คํ์ ํตํด ์ป๊ฒ ๋๋ ๋น์ฆ๋์ค ํจ๊ณผ ์ธก๋ฉด์ ์์๋ก, ๊ธฐ์
๋ฐ์ดํฐ ๋ถ์์ ํตํด ์ถ๊ตฌํ๊ฑฐ๋ ๋ฌ์ฑํ๊ณ ์ ํ๋ ๋ชฉํ ๊ฐ์น๋ฅผ ์๋ฏธํ๋ค.
* ๊ณผ์ ์ฐ์ ์์ ํ๊ฐ๊ธฐ์ค
1) ์๊ธ์ฑ : ์ ๋ต์ ์ค์๋, ๋ชฉํ๊ฐ์น(KPI) - ๊ฐ์น(Value) - ๋น์ฆ๋์ค ํจ๊ณผ(Return)
2) ๋์ด๋ : ๋ฐ์ดํฐ ํ๋ / ์ ์ฅ / ๊ฐ๊ณต๋น์ฉ, ๋ถ์ ์ ์ฉ ๋น์ฉ, ๋ถ์ ์์ค - ํฌ๊ธฐ(Volume), ๋ค์์ฑ(Variety), ์๋(Velocity) - ํฌ์๋น์ฉ ์์(Investment)
2_2. ๋ถ์ ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ ์๋ฆฝ
* ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ ๊ตฌ์ฑ์์
- ๋ง์คํฐ ํ๋ ์๋ฆฝ ์์ ์์ ๋ฐ์ดํฐ ๋ถ์์ ์ง์์ ์ธ ์ ์ฉ๊ณผ ํ์ฐ์ ์ํ ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ๋ ๋ถ์ ๊ธฐํ ๋ฐ ๊ด๋ฆฌ๋ฅผ ์ํํ๋ ์กฐ์ง(Organization), ๊ณผ์ ๊ธฐํ ๋ฐ ์ด์ ํ๋ก์ธ์ค(Process), ๋ถ์ ๊ด๋ จ ์์คํ
(System), ๋ฐ์ดํฐ(Data), ๋ถ์ ๊ด๋ จ ๊ต์ก ๋ฐ ๋ง์ธ๋ ์ก์ฑ ์ฒด๊ณ(Human Resource)๋ก ๊ตฌ์ฑ๋๋ค.
* ๋ฐ์ดํฐ ๋ถ์ ์์ค ์ง๋จ 2๊ฐ์ง
1) ๋ถ์ ์ค๋น๋
๋ชฉํ : ๊ธฐ์
์ ๋ฐ์ดํฐ ๋ถ์ ๋์
์ ์์ค์ ํ์
ํ๊ธฐ ์ํ ์ง๋จ๋ฐฉ๋ฒ
๊ตฌ์ฑ : ๋ถ์์
๋ฌดํ์
, ์ธ๋ ฅ ๋ฐ ์กฐ์ง, ๋ถ์๊ธฐ๋ฒ, ๋ถ์ ๋ฐ์ดํฐ, ๋ถ์๋ฌธํ, IT์ธํ๋ผ
์ง๋จ ๊ณผ์
1. ์์ญ๋ณ๋ก ์ธ๋ถ ํญ๋ชฉ์ ๋ํ ์์คํ์
2. ์ง๋จ๊ฒฐ๊ณผ ์ ์ฒด ์๊ฑด ์ค ์ผ์ ์์ค์ด์ ์ถฉ์กฑํ๋ฉด ๋ถ์์
๋ฌด ๋์
3. ์ถฉ์กฑํ์ง ๋ชปํ ์ ๋ถ์ ํ๊ฒฝ ์กฐ์ฑ
2) ๋ถ์ ์ฑ์๋ ๋ชจ๋ธ
์กฐ์ง์ ์ฑ์๋ ํ๊ฐ ๋๊ตฌ : CMMI(Capability Maturity Model Integration) ๋ชจ๋ธ
์ฑ์๋ ์์ค๋ถ๋ฅ :
1. ๋์
๋จ๊ณ : ๋ถ์์ ์์ํ์ฌ ํ๊ฒฝ๊ณผ ์์คํ
์ ๊ตฌ์ถ
2. ํ์ฉ ๋จ๊ณ : ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ์ค์ ์
๋ฌด์ ์ ์ฉ
3. ํ์ฐ ๋จ๊ณ : ์ ์ฌ ์ฐจ์์์ ๋ถ์์ ๊ด๋ฆฌํ๊ณ ๊ณต์
์ต์ ํ ๋จ๊ณ : ๋ถ์์ ์งํ์์ผ์ ํ์ ๋ฐ ์ฑ๊ณผ ํฅ์์ ๊ธฐ์ฌ
๋ถ์ ์ฑ์๋ ์ง๋จ ๋ถ๋ฅ : ๋น์ง๋์ค ๋ถ๋ฌธ, ์กฐ์งใฎ์ญ๋ ๋ถ๋ฌธ, IT๋ถ๋ฌธ
* ๋ถ์ ๊ด์ ์์ ์ฌ๋ถ๋ฉด ๋ถ์(Analysis Quadrant)
ํ์ฐํ : ๊ธฐ์
์ ํ์ํ 6๊ฐ์ง ๋ถ์ ๊ตฌ์ฑ์์๋ฅผ ๊ฐ์ถ๊ณ ์๊ณ , ํ์ฌ ๋ถ๋ถ์ ์ผ๋ก ๋์
๋์ด ์ง์์ ์ธ ํ์ฐ์ด ํ์ํ ๊ธฐ์
- ์ฑ์๋ ๋์, ์ค๋น๋ ๋์
๋์
ํ : ๊ธฐ์
์์ ํ์ฉํ๋ ๋ถ์ ์
๋ฌด, ๊ธฐ๋ฒ ๋ฑ์ ๋ถ์กฑํ์ง๋ง ์ ์ฉ ์กฐ์ง ๋ฑ ์ค๋น๋๊ฐ ๋์ ๋ฐ๋ก ๋์
ํ ์ ์๋ ๊ธฐ์
- ์ฑ์๋ ๋ฎ์, ์ค๋น๋ ๋์
์ค๋นํ : ๊ธฐ์
์์ ํ์ํ ๋ฐ์ดํฐ, ์ธ๋ ฅ, ์กฐ์ง, ๋ถ์ ์
๋ฌด, ๋ถ์ ๊ธฐ๋ฒ, ๋ฑ์ด ์ ์ฉ๋์ด ์์ง ์์ ์ฌ์ ์ค๋น๊ฐ ํ์ํ ๊ธฐ์
- ์ฑ์๋ ๋ฎ์, ์ค๋น๋ ๋ฎ์
์ ์ฐฉํ : ์ค๋น๋๋ ๋ฎ์ผ๋ ์กฐ์ง, ์ธ๋ ฅ, ๋ถ์ ์
๋ฌด, ๋ถ์ ๊ธฐ๋ฒ ๋ฑ์ ๊ธฐ์
๋ด๋ถ์์ ์ ํ์ ์ผ๋ก ์ฌ์ฉํ๊ณ ์์ด 1์ฐจ์ ์ผ๋ก ์ ์ฐฉ์ด ํ์ํ ๊ธฐ์
- ์ฑ์๋ ๋์, ์ค๋น๋ ๋ฎ์
2_3. ๋ถ์์ง์ ์ธํ๋ผ ๋ฐฉ์ ์๋ฆฝ
* ๋ถ์ํ๋ซํผ
- ๋จ์ํ ๋ถ์ ์์ฉํ๋ก๊ทธ๋จ๋ฟ๋ง ์๋๋ผ ๋ถ์ ์๋น์ค๋ฅผ ์ํ ์์ฉํ๋ก๊ทธ๋จ์ด ์คํ๋ ์ ์๋ ๊ธฐ์ด๋ฅผ ์ด๋ฃจ๋ ์ปดํจํฐ ์์คํ
์ ์๋ฏธํ๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ํ๋์จ์ด์ ํ์ฌ๋์ด ๋ฐ์ดํฐ ๋ถ์์ ํ์ํ ํ๋ก๊ทธ๋๋ฐ ํ๊ฒฝ๊ณผ ์คํ ๋ฐ ์๋น์ค ํ๊ฒฝ์ ์ ๊ณตํ๋ ์ญํ ์ ์ํํ๋ค.
- ๋ถ์ํ๋ซํผ์ด ๊ตฌ์ฑ๋์ด ์๋ ๊ฒฝ์ฐ์๋ ์๋ก์ด ๋ฐ์ดํฐ ๋ถ์ ๋์ฆ๊ฐ ์กด์ฌํ ๊ฒฝ์ฐ ๊ฐ๋ณ์ ์ธ ๋ถ์ ์์คํ
์ ์ถ๊ฐํ๋ ๋ฐฉ์์ด ์๋ ์๋น์ค๋ฅผ ์ถ๊ฐ์ ์ผ๋ก ์ ๊ณตํ๋ ๋ฐฉ์์ผ๋ก ํ์ฅ์ฑ์ ๋์ผ ์ ์๋ค.
2_4. ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ ์๋ฆฝ
* ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค
- ์ ์ฌ ์ฐจ์์ ๋ชจ๋ ๋ฐ์ดํฐ์ ๋ํ์ฌ ์ ์ฑ
๋ฐ ์ง์นจ, ํ์คํ, ์ด์์กฐ์ง ๋ฐ ์ฑ
์ ๋ฑ์ ํ์คํ๋ ๊ด๋ฆฌ์ฒด๊ณ๋ฅผ ์๋ฆฝํ๊ณ ์ด์์ ์ํ ํ๋ ์์ํฌ(Framework) ๋ฐ ์ ์ฅ์(Repository)๋ฅผ ๊ตฌ์ถํ๋ ๊ฒ์ ๋งํ๋ค.
- ๋ง์คํฐ ๋ฐ์ดํฐ(Master Data), ๋ฉํ ๋ฐ์ดํฐ(Meta Data), ๋ฐ์ดํฐ ์ฌ์ (Data Dictionary)์ ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค์ ์ค์ํ ๊ด๋ฆฌ ๋์์ด๋ค.
* ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค ๊ตฌ์ฑ 3์์
1) ์์น(Principle)
- ๋ฐ์ดํฐ๋ฅผ ์ ์งใฎ๊ด๋ฆฌํ๊ธฐ ์ํ ์ง์นจ๊ณผ ๊ฐ์ด๋
- ๋ณด์, ํ์ง ๊ธฐ์ค, ๋ณ๊ฒฝ๊ด๋ฆฌ
2) ์กฐ์ง(Organization)
- ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ ์กฐ์ง์ ์ญํ ๊ณผ ์ฑ
์
- ๋ฐ์ดํฐ ๊ด๋ฆฌ์, ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ด๋ฆฌ์, ๋ฐ์ดํฐ ์ํคํ
ํธ(Data Architect)
3) ํ๋ก์ธ์ค(Process)
- ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ์ํ ํ๋๊ณผ ์ฒด๊ณ
- ์์
์ ์ฐจ, ๋ชจ๋ํฐ๋ง ํ๋, ์ธก์ ํ๋
* ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ
1) ๋ฐ์ดํฐ ํ์คํ
- ๋ฐ์ดํฐ ํ์คํ๋ ๋ฐ์ดํฐ ํ์ค ์ฉ์ด ์ค์ , ๋ช
๋ช
๊ท์น(Name Rule)์๋ฆฝ, ๋ฉํ ๋ฐ์ดํฐ(Meta Data)๊ตฌ์ถ, ๋ฐ์ดํฐ ์ฌ์ (Data Dictionary)๊ตฌ์ถ ๋ฑ์ ์
๋ฌด๋ก ๊ตฌ์ฑ๋๋ค.
- ๋ฐ์ดํฐ ํ์ค์ฉ์ด๋ ํ์ค ๋จ์ด์ฌ์ , ํ์ค ๋๋ฉ์ธ์ฌ์ , ํ์ค ์ฝ๋ ๋ฑ์ผ๋ก ๊ตฌ์ฑ๋๋ฉฐ ์ฌ์ ๊ฐ ์ํธ ๊ฒ์ฆ์ด ๊ฐ๋ฅํ๋๋ก ์ ๊ฒ ํ๋ก์ธ์ค๋ฅผ ํฌํจํด์ผ ํ๋ค.
- ๋ช
๋ช
๊ท์น์ ํ์์ ์ธ์ด๋ณ(ํ๊ธ, ์์ด ๋ฑ)๋ก ์์ฑ๋์ด ๋งคํ ์ํ๋ฅผ ์ ์งํด์ผ ํ๋ค.
2) ๋ฐ์ดํฐ ๊ด๋ฆฌ ์ฒด๊ณ
- ๋ฐ์ดํฐ ์ ํฉ์ฑ ๋ฐ ํ์ฉ์ ํจ์จ์ฑ์ ์ํ์ฌ ํ์ค ๋ฐ์ดํฐ๋ฅผ ํฌํจํ ๋ฉํ ๋ฐ์ดํฐ(Meta Data)์ ๋ฐ์ดํฐ ์ฌ์ (Data Dictionary)์ ๊ด๋ฆฌ ์์น์ ์๋ฆฝํ๋ค.
- ์๋ฆฝ๋ ์์น์ ๊ทผ๊ฑฐํ์ฌ ํญ๋ชฉ๋ณ ์์ธํ ํ๋ก์ธ์ค๋ฅผ ๋ง๋ค๊ณ ๊ด๋ฆฌ์ ์ด์์ ์ํ ๋ด๋น์ ๋ฐ ์กฐ์ง๋ณ ์ญํ ๊ณผ ์ฑ
์์ ์์ธํ๊ฒ ์ค๋นํ๋ค.
- ๋น
๋ฐ์ดํฐ์ ๊ฒฝ์ฐ ๋ฐ์ดํฐ์์ ๊ธ์ฆ์ผ๋ก ๋ฐ์ดํฐ์ ์๋ช
์ฃผ๊ธฐ ๊ด๋ฆฌ๋ฐฉ์(Data Life Cycle Management)์ ์๋ฆฝํ์ง ์์ผ๋ฉด ๋ฐ์ดํฐ ๊ฐ์ฉ์ฑ ๋ฐ ๊ด๋ฆฌ๋น์ฉ ์ฆ๋ ๋ฌธ์ ์ ์ง๋ฉดํ๊ฒ ๋ ์ ์๋ค.
3) ๋ฐ์ดํฐ ์ ์ฅ์ ๊ด๋ฆฌ(Repository)
- ๋ฉํ๋ฐ์ดํฐ ๋ฐ ํ์ค ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ๊ธฐ ์ํ ์ ์ฌ ์ฐจ์์ ์ ์ฅ์๋ฅผ ๊ตฌ์ฑํ๋ค.
- ์ ์ฅ์๋ ๋ฐ์ดํฐ ๊ด๋ฆฌ ์ฒด๊ณ ์ง์์ ์ํ ์ํฌํ๋ก์ฐ(Workflow) ๋ฐ ๊ด๋ฆฌ์ฉ ์์ฉ ์ํํธ์จ์ด(Application)๋ฅผ ์ง์ํ๊ณ ๊ด๋ฆฌ ๋์ ์์คํ
๊ณผ์ ์ธํฐํ์ด์ค๋ฅผ ํตํ ํต์ ๊ฐ ์ด๋ฃจ์ด์ ธ์ผํ๋ค.
- ๋ฐ์ดํฐ ๊ตฌ์กฐ ๋ณ๊ฒฝ์ ๋ฐ๋ฅธ ์ฌ์ ์ํฅ ํ๊ฐ๋ ์ํ๋์ด์ผ ํจ์จ์ ์ธ ํ์ฉ์ด ๊ฐ๋ฅํ๋ค.
4) ํ์คํ ํ๋
- ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค ์ฒด๊ณ๋ฅผ ๊ตฌ์ถํ ํ ํ์ค ์ค์ ์ฌ๋ถ๋ฅผ ์ฃผ๊ธฐ์ ์ผ๋ก ์ ๊ฒํ๊ณ ๋ชจ๋ํฐ๋ง์ ์ค์ํ๋ค.
- ๊ฑฐ๋ฒ๋์ค์ ์กฐ์ง ๋ด ์์ ์ ์ ์ฐฉ์ ์ํ ๊ณ์์ ์ธ ๋ณํ ๊ด๋ฆฌ ๋ฐ ์ฃผ๊ธฐ์ ์ธ ๊ต์ก์ ์งํํ๋ค.
- ์ง์์ ์ธ ๋ฐ์ดํฐ ํ์คํ ๊ฐ์ ํ๋์ ํตํ์ฌ ์ค์ฉ์ฑ์ ๋์ฌ์ผ ํ๋ค.
2_5. ๋ฐ์ดํฐ ์กฐ์ง ๋ฐ ์ธ๋ ฅ๋ฐฉ์ ์๋ฆฝ
* ๋ถ์์ ์ํ 3๊ฐ์ง ์กฐ์ง ๊ตฌ์ฑ
1) ์ง์ค๊ตฌ์กฐ
- ์ ์ฌ ๋ถ์์
๋ฌด๋ฅผ ๋ณ๋์ ๋ถ์์ ๋ด ์กฐ์ง์์ ๋ด๋น
- ์ ๋ต์ ์ค์๋์ ๋ฐ๋ผ ๋ถ์์กฐ์ง์ด ์ฐ์ ์์๋ฅผ ์ ํด์ ์งํ ๊ฐ๋ฅ
- ํ์
์
๋ฌด๋ถ์์ ๋ถ์์
๋ฌด์ ์ด์คํ/์ด์ํ ๊ฐ๋ฅ์ฑ ๋์
2) ๊ธฐ๋ฅ๊ตฌ์กฐ
- ์ผ๋ฐ์ ์ธ ๋ถ์ ์ํ ๊ตฌ์กฐ, ๋ณ๋ ๋ถ์์กฐ์ง์ด ์๊ณ ํด๋น ์
๋ฌด ๋ถ์์์ ๋ถ์ ์ํ
- ๋ณ๋ ๋ถ์์กฐ์ง์ด ์๊ณ ํด๋น ์
๋ฌด ๋ถ์์์ ๋ถ์ ์ํ
- ์ ์ฌ์ ํต์ฌ๋ถ์์ด ์ด๋ ค์ฐ๋ฉฐ, ๋ถ์ ํํฉ ๋ฐ ์ค์ ํต๊ณ ๋ฑ ๊ณผ๊ฑฐ ์ค์ ์ ๊ตญํ๋ ๋ถ์ ์ํ ๊ฐ๋ฅ์ฑ ๋์
3) ๋ถ์ฐ๊ตฌ์กฐ
- ๋ถ์์กฐ์ง ์ธ๋ ฅ๋ค์ ํ์
๋ถ์๋ก ์ง์ ๋ฐฐ์นํ์ฌ ๋ถ์์
๋ฌด ์ํ
- ์ ์ฌ์ฐจ์์ ์ฐ์ ์์ ์ํ
- ๋ถ์๊ฒฐ๊ณผ์ ๋ฐ๋ฅธ ์ ์ํ Action ๊ฐ๋ฅ
- ๋ฒ ์คํธ ํ๋ํฐ์ค ๊ณต์ ๊ฐ๋ฅ
- ๋ถ์ ๋ถ์์
๋ฌด์ ์ญํ ๋ถ๋ด ๋ช
ํํ ํด์ผํจ(->์
๋ฌด๊ณผ๋ค ์ด์ํ ๊ฐ๋ฅ์ฑ)
2_6. ๋ถ์ ๊ณผ์ ๊ด๋ฆฌ ํ๋ก์ธ์ค ์๋ฆฝ
* ๋ถ์ ๊ณผ์ ๊ด๋ฆฌ ํ๋ก์ธ์ค
1) ๊ณผ์ ๋ฐ๊ตด : ๊ฐ๋ณ ์กฐ์ง์ด๋ ๊ฐ์ธ์ด ๋์ถํ ๋ถ์ ์์ด๋์ด๋ฅผ ๋ฐ๊ตดํ๊ณ ์ด๋ฅผ ๊ณผ์ ํํ์ฌ ๋ถ์ ๊ณผ์ ํ(Pool)๋ก ๊ด๋ฆฌํ๋ฉด์ ๋ถ์ ํ๋ก์ ํธ๋ฅผ ์ ์ ํ๋ ์์
์ ์ํํ๋ค
ํ๋ก์ธ์ค : 1.๋ถ์ Idea ๋ฐ๊ตด -> 2.๋ถ์๊ณผ์ ํ๋ณด์ ์ -> 3.๋ถ์๊ณผ์ ํ์
2) ๊ณผ์ ์ํ : ๋ถ์์ ์ํํ ํ์ ๊ตฌ์ฑํ๊ณ ๋ถ์ ๊ณผ์ ์คํ ์ ์ง์์ ์ธ ๋ชจ๋ํฐ๋ง๊ณผ ๊ณผ์ ๊ฒฐ๊ณผ๋ฅผ ๊ณต์ ํ๊ณ ๊ฐ์ ํ๋ ์ ์ฐจ๋ฅผ ์ํํ๋ค.
ํ๋ก์ธ์ค : 4.ํ๊ตฌ์ฑ -> 5.๋ถ์๊ณผ์ ์คํ -> 6.๋ถ์๊ณผ์ ์งํ๊ด๋ฆฌ -> 7.๊ฒฐ๊ณผ ๊ณต์ /๊ฐ์
'๐์๊ฒฉ์ฆ > ๐ADsP(๋ฐ์ดํฐ๋ถ์์ค์ ๋ฌธ๊ฐ)' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[ADsP] ์๊ฒฉ์ฆ์ ๊ฐ์น๋ ์ด๋์ ๋์ผ๊น? (feat.๊ณต๊ธฐ์ ) (0) | 2021.11.02 |
---|---|
๋น์ ๊ณต์ ADSP ํฉ๊ฒฉ ํ๊ธฐ (0) | 2021.09.26 |
[ADsP 3๊ณผ๋ชฉ] ์ด๊ฐ๋จ ์์ฝ ์ ๋ฆฌ(1/3) + 30ํ ๊ธฐ์ถ๋ฌธ์ (0) | 2021.09.02 |
[ADsP 1๊ณผ๋ชฉ] ์ด๊ฐ๋จ ์์ฝ ์ ๋ฆฌ + 30ํ ๊ธฐ์ถ๋ฌธ์ (0) | 2021.09.02 |
[3๊ณผ๋ชฉ] ์๊ณ์ด ๋ถ์ (0) | 2021.09.02 |