๋ถ„๋ฅ˜ ์ „์ฒด๋ณด๊ธฐ

    ๋‚˜์˜ ์ฒซ ํƒœ๋ธ”๋กœ ์‚ฌ์šฉ๊ธฐ : ์ž…๋ฌธ

    ๋‚˜์˜ ์ฒซ ํƒœ๋ธ”๋กœ ์‚ฌ์šฉ๊ธฐ : ์ž…๋ฌธ

    ๋ฐฉ๊ธˆ ํ”„๋กœ๊ทธ๋žจ์„ ๋‹ค์šด๋ฐ›๊ณ  ์ฒ˜์Œ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์—ฐ๊ฒฐํ•ด๋ณด์•˜๋‹ค. ๊ฐ€์„ฑ๋น„ ์žˆ๋Š” ์™ธ์ œ์ฐจ ๋ฝ‘๋Š” ๋ฐฉ๋ฒ•์„ ์ฐพ์•˜๋‹ค. ํ•ด๋‹น ์ฐจ์ข… ํ‰๊ท  ๊ณก์„  ์ดํ•˜์— ์žˆ๋Š” ๋ชจ๋ธ์„ ์ฐพ์œผ๋ฉด ๋œ๋‹ค. ํ•˜ํ•˜ 12-02 ํƒœ๋ธ”๋กœ ์ปค๋ฎค๋‹ˆํ‹ฐ์— ์ข‹์€ ์ž๋ฃŒ๊ฐ€ ๋งŽ์ด ์˜ฌ๋ผ์™€์žˆ๋‹ค, ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™”์— ํ™œ์šฉํ•˜๊ณ , ์ผ์›์œผ๋กœ์„œ ํ™œ๋™ํ•ด๋ณด์ž http://tableauwiki.com/blog/

    crawling parrel processing

    crawling parrel processing

    this is completed with just one virtual env. Not taking too much cpu memories

    [๋ฐฑ์ค€]10798. ์„ธ๋กœ์“ฐ๊ธฐ

    ์ด ๋‹ค์„ฏ์ค„์˜ ์ž…๋ ฅ์ด ์ฃผ์–ด์ง„๋‹ค. ๊ฐ ์ค„์—๋Š” ์ตœ์†Œ 1๊ฐœ, ์ตœ๋Œ€ 15๊ฐœ์˜ ๊ธ€์ž๋“ค์ด ๋นˆ์นธ ์—†์ด ์—ฐ์†์œผ๋กœ ์ฃผ์–ด์ง„๋‹ค. ์ฃผ์–ด์ง€๋Š” ๊ธ€์ž๋Š” ์˜์–ด ๋Œ€๋ฌธ์ž ‘A’๋ถ€ํ„ฐ ‘Z’, ์˜์–ด ์†Œ๋ฌธ์ž ‘a’๋ถ€ํ„ฐ ‘z’, ์ˆซ์ž ‘0’๋ถ€ํ„ฐ ‘9’ ์ค‘ ํ•˜๋‚˜์ด๋‹ค. ๊ฐ ์ค„์˜ ์‹œ์ž‘๊ณผ ๋งˆ์ง€๋ง‰์— ๋นˆ์นธ์€ ์—†๋‹ค. In [1]: # ์„ธ๋กœ ์ฝ๊ธฐ space = [] for row in range(5): row = [0] * 15 space.append(row) space Out[1]: [[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], [0, 0, 0, 0, ..

    [python] Yotube crawling , ์ž๋™ ํฌ๋กค๋Ÿฌ ๊ฐœ๋ฐœ

    [python] Yotube crawling , ์ž๋™ ํฌ๋กค๋Ÿฌ ๊ฐœ๋ฐœ

    ๊ฒ€์ƒ‰์–ด๋ฅผ ์ž…๋ ฅํ•˜๋ฉด ํ•ด๋‹น ์˜์ƒ์„ ์กฐํšŒ์ˆ˜์ˆœ์œผ๋กœ ํ•„ํ„ฐ๋ฅผ ์ ์šฉํ•˜์—ฌ, ์ „์„ธ๊ณ„ ์˜์ƒ์„ ๋†’์€๊ฒƒ๋ถ€ํ„ฐ ์ฐจ๋ก€๋Œ€๋กœ ์•ฝ 400~600๊ฐœ ์ •๋„์˜ ์˜์ƒ๋“ค์„ ๊ฐ๊ฐ ์‚ฌ์ดํŠธ ์ฃผ์†Œ ์ •๋ณด๋ฅผ ๋”ฐ๋กœ ํ…Œ์ด๋ธ”์„ ๋งŒ๋“ค์–ด ์ €์žฅํ•˜๊ณ , (DB 1๋‹จ๊ณ„ - ์ •๊ทœํ™”) ๊ทธ๋ฆฌ๊ณ  ๊ฐ ์‚ฌ์ดํŠธ ๋งˆ๋‹ค์˜ ํ•ด๋‹น ์˜์ƒ์˜ ๋Œ“๊ธ€์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ์ธ๊ธฐ์ˆœ์œผ๋กœ ๋‚˜์—ดํ•˜์—ฌ, ์„ ํ˜ธ๋„๊ฐ€ ๋†’์€ ๋Œ“๊ธ€ ์ˆœ์„œ ์œ„์ฃผ๋กœ, ๋‚˜์ค‘์— ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ๊ฐ€ ํŽธํ•˜๊ฒŒ ๋‚˜์—ดํ•˜์—ฌ ํ…Œ์ด๋ธ”์„ ๊ตฌ์ƒํ•˜์˜€๋‹ค. (DB 2๋‹จ๊ณ„- ๋ฐ˜์ •๊ทœํ™”) ์—ฌ๊ธฐ์„œ ์‚ด์ง ๊ณ ๋ฏผ๋˜๋Š”๊ฒŒ, 1์ฐจ๋กœ DB ์„ค๊ณ„์‹œ, ํ•ด๋‹น ์˜์ƒ์˜ ๋žญํ‚น ์ˆœ์„œ์™€ url ์ˆœ์„œ๋งŒ ๊ฐ€์ง€๊ณ  ์™”์—ˆ๋‹ค. url ๋„ ๊ณ ์œ ์„ฑ์„ ๊ฐ–๊ธฐ ๋•Œ๋ฌธ์— ์ธ๋ฑ์Šค๋กœ์„œ ์‚ฌ์šฉํ•  ์ˆ˜๋Š” ์žˆ์ง€๋งŒ, ์• ์ดˆ์— ์ฐจ๋ผ๋ฆฌ ๊ณ ์œ ์˜ ์ธ๋ฑ์Šค๋ฒˆํ˜ธ๋ฅผ ์ˆœ์ฐจ์ ์œผ๋กœ ์ฃผ์–ด์„œ ์ฐจ๋Ÿ‰ ๋ชจ๋ธ ๋ฐ ํ‚ค์›Œ๋“œ ๊ด€๋ จ ๋Œ“๊ธ€ ๋ฐ์ดํ„ฐ 70 ๊ฐœ * 600 ๊ฐœ ์‚ฌ์ดํŠธ * 100..

    [python] ์ž๋™์ฐจ ํฌ๋กค๋ง

    [python] ์ž๋™์ฐจ ํฌ๋กค๋ง

    ๋“œ๋””์–ด ๊ฐ ์‚ฌ์ดํŠธ๋งˆ๋‹ค, ์ค‘๊ณ ์ฐจ ์ •๋ณด(๊ฐ€๊ฒฉ,์—ฐ์‹,๊ฐ€๊ฒฉ)๋“ฑ์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ๋‹ด์€ ํฌ๋กค๋Ÿฌ๋ฅผ ๊ฐœ๋ฐœํ–ˆ๋‹ค. ใ…‹ใ…‹ใ…‹ ํ—คํ—ท k-car ์—์„œ 2021-11-28 ํ˜„์žฌ ํฌ๋กค๋งํ•œ ๊ฒฐ๊ณผ ์ค‘๊ณ ์ž๋™์ฐจ ๊ฐ€๊ฒฉ, ์ž๋™์ฐจ ์ •๋ณด, ํฌ๋กค๋ง, ํŒŒ์ด์„ ์„ ํ™œ์šฉํ•ด์„œ, ์ „์ฒด์ ์ธ ํŠธ๋ Œ๋“œ๋ฅผ ์•Œ๊ธฐ ์œ„ํ•ด ์กฐ์‚ฌํ•ด๋ณธ๋‹ค. ์‚ฌ์‹ค ์•„์ง ์ „์ฒ˜๋ฆฌ ๊ณผ์ •์ด ์กฐ๊ธˆ ๋‚จ๊ธดํ–ˆ๋‹ค. 980๋งŒ์› ๊ฐ™์€ ๊ฒฝ์šฐ, ์ˆซ์ž๋กœ ๋ณ€ํ™˜ํ•ด์ค˜์•ผํ•˜๋Š”๋ฐ, replace ๊ตฌ๋ฌธ๋“ฑ์„ ์“ฐ์ง€ ๋ชปํ–ˆ๋‚˜๋ณด๋‹ค.

    [python ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ]ํŒŒ์ด์„  ํŠน์ • ๋ฌธ์ž์—ด ํ–‰ ์‚ญ์ œ

    ํฌ๋กค๋งํ•˜๋ฉด์„œ, ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ๋ฅผ ๋ฏธ๋ฆฌ ํฌ๋กค๋งํ•˜๋Š” ๋‹จ๊ณ„์—์„œ ํ•ด๋†“์œผ๋ฉด ์ „์ฒด์ ์ธ ํ…Œ์ด๋ธ”์„ ์ƒ์„ฑํ•˜๋Š”๋ฐ ํฐ ๋„์›€์ด ๋œ๋‹ค. [19๋…„ 10์›”์‹, 18๋…„ 9์›”์‹(19๋…„ํ˜•), 13๋…„ 6์›”์‹(14๋…„ํ˜•), 17๋…„ 10์›”์‹(18๋…„ํ˜•), 20๋…„ 5์›”์‹, 16๋…„ 4์›”์‹, 18๋…„ 2์›”์‹, 19๋…„ 6์›”์‹(20๋…„ํ˜•), 17๋…„ 11์›”์‹(18๋…„ํ˜•), 17๋…„ 8์›”์‹(18๋…„ํ˜•), 17๋…„ 10์›”์‹(18๋…„ํ˜•), 16๋…„ 3์›”์‹, 15๋…„ 12์›”์‹(16๋…„ํ˜•), 17๋…„ 7์›”์‹(18๋…„ํ˜•), 17๋…„ 11์›”์‹(18๋…„ํ˜•), 15๋…„ 1์›”์‹, 14๋…„ 2์›”์‹, 16๋…„ 2์›”์‹, 19๋…„ 12์›”์‹(20๋…„ํ˜•), 21๋…„ 4์›”์‹(22๋…„ํ˜•), 15๋…„ 9์›”์‹, 20๋…„ 12์›”์‹(21๋…„ํ˜•), 19๋…„ 11์›”์‹, 18๋…„ 1์›”์‹, 16๋…„ 3์›”์‹, show more (open the raw..

    [Git] ๋ช…๋ น์–ด ๊ณต๋ถ€/

    [Git] ๋ช…๋ น์–ด ๊ณต๋ถ€/

    1. ๋ช…๋ น์–ด mkdir gitfth ์ƒˆ๋กœ์šด ํŒŒ์ผ ๋งŒ๋“ค๊ธฐ PS C:\Users\smhrd\Desktop\VS_Python> mkdir gitfth cd gitfth ํ•ด๋‹น ํด๋”๋กœ ๋””๋ ‰ํ† ๋ฆฌ๋ฅผ ๋ณ€๊ฒฝํ•ฉ๋‹ˆ๋‹ค. PS C:\Users\smhrd\Desktop\VS_Python> cd gitfth git init ํ˜„์žฌ ๋””๋ ‰ํ† ๋ฆฌ๋ฅผ ๊นƒ์˜ ๋ฒ„์ „ ์ €์žฅ์†Œ๋กœ ๊ด€๋ฆฌํ•ฉ๋‹ˆ๋‹ค. PS C:\Users\smhrd\Desktop\VS_Python\gitfth> git init ํ”„๋กœ์ ํŠธ ํด๋” ์ƒํƒœ ํ™•์ธํ•˜๊ธฐ git status Commit - ๋ฒ„์ „ ๊ด€๋ฆฌํ•˜๊ธฐ ๋ฒ„์ „์— ํฌํ•จ๋  ๋ฒ„์ „์„ ๋งŒ๋“  ์‚ฌ๋žŒ์— ๋Œ€ํ•œ ์ •๋ณด๋ฅผ ์„ค์ •ํ•ฉ๋‹ˆ๋‹ค. ์„ค์ •์€ ~/.gitconfig ํŒŒ์ผ์— ์ €์žฅ๋˜๊ณ  1๋ฒˆ๋งŒ ํ•ด์ฃผ๋ฉด ๋ฉ๋‹ˆ๋‹ค. PS C:\Users\smhrd\Desktop\VS_Python..

    [Git] Commit

    [Git] Commit

    ๊นƒ, ๊นƒํ—ˆ๋ธŒ๋ฅผ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋ธŒ๋žœ์น˜๋ผ๋Š” ๊ฐœ๋…์„ ์•Œ์•„์•ผํ•œ๋‹ค๊ณ  ํ•ฉ๋‹ˆ๋‹ค. Git ๊ทธ์ „์— ์šฐ์„  ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ git ์— ๋Œ€ํ•˜์—ฌ ์š”์•ฝํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. - ์ปดํ“จํ„ฐ๋กœ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋ฉด, ํŒŒ์ผ์ด ์ƒ์„ฑ๋˜๋Š”๋ฐ, ํ•œ๋ฒˆ ์ƒ์„ฑํ•œ ํŒŒ์ผ์€ ํŠนํžˆ ์ฝ”๋”ฉ ๊ฐ™์€ ๊ฒฝ์šฐ ๊ณ„์† ์ˆ˜์ •์ด ์ด๋ค„์ง€๋Š”๊ฒŒ ๋ณดํ†ต์˜ ์ผ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ๋งค๋ฒˆ ์ƒˆ๋กœ์šด ๋ฒ„์ „์œผ๋กœ ์—…๋ฐ์ดํŠธํ• ๋•Œ, ์ด์ „์˜ ํŽธ์ง‘์„ ์ˆ˜ํ–‰ํ•œ ํŒŒ์ผ์— ๋Œ€ํ•œ ์ •๋ณด๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋ฉด ์–ด๋–จ๊นŒ์š”. ๋ฌผ๋ก  ๋ฏธ๋ฆฌ ํ•ด๋‹น ํŒŒ์ผ์„ ๋ณต์‚ฌํ•ด์„œ ๋”ฐ๋กœ ๋ณด๊ด€ํ•˜๊ณ  ์žˆ๋‹ค๋ฉด ์ƒ๊ด€์—†์ง€๋งŒ, ์‹ค์ œ๋กœ๋Š” ์—„์ฒญ ๋ฒˆ๊ฑฐ๋กญ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์‹ค์ˆ˜๋กœ ํŒŒ์ผ๋ช…์„ ๋ˆ„๋ฝํ•˜๊ฑฐ๋‚˜, ์ €์žฅํ•˜๋Š” ๊ฒƒ์„ ๊นœ๋นกํ•˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์–ด, ์‹ค์ œ๋กœ๋Š” ์ด๋Ÿฌํ•œ ๋ถˆํŽธํ•จ์ด ์žˆ์–ด, Git ๊ณผ ๊ฐ™์€ ๋ฒ„์ „ ๊ด€๋ฆฌ ์‹œ์Šคํ…œ์ด ์กด์žฌํ•˜์—ฌ ๋ฒ„์ „ ๊ด€๋ฆฌ์— ๋”ฐ๋ฅธ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ด์ค๋‹ˆ๋‹ค. Git์€ ์†Œ์Šค์ฝ”๋“œ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ..

    [python] os ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๊ฒฝ๋กœ ์„ค์ • - os.getcwd(), path

    [python] os ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ๊ฒฝ๋กœ ์„ค์ • - os.getcwd(), path

    Python์—์„œ os ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ด์šฉํ•ด์„œ ๊ฒฝ๋กœ ์„ค์ •ํ•˜๋Š” ๋ฐฉ๋ฒ• ํŒŒ์ผ์„ ์ฝ๊ณ  ์“ฐ๋ ค๋ฉด ์šฐ์„  ์›ํ•˜๋Š” ๊ฒฝ๋กœ๋ฅผ ์ง€์ •ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋Š”๋ฐ, ์œˆ๋„์šฐ, Mac os, ๋ฆฌ๋ˆ…์Šค ๋“ฑ ๊ฐ ์šด์˜์ฒด์ œ์—์„œ๋Š” ๊ฒฝ๋กœ๋ฅผ ์ง€์ •ํ•  ๋•Œ ๊ตฌ๋ถ„ํ•˜๋Š” ๊ธฐํ˜ธ๋ฅผ ์“ฐ๋Š”๋ฐ ์œˆ๋„์šฐ์—์„  ๋ฐฑ์Šฌ๋ž˜์‹œ(\)๋ฅผ ์‚ฌ์šฉํ•˜์ง€๋งŒ, Mac os์—์„œ๋Š” ์Šฌ๋ž˜์‹œ(/)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๊ฒฝ๋กœ๋ฅผ ์ง€์ •ํ•˜๋ ค๋ฉด ์šด์˜์ฒด์ œ์— ๋”ฐ๋ผ ๋‹ค๋ฅด๊ฒŒ ์ฒ˜๋ฆฌํ•ด์ฃผ์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿด ๋•Œ์— ์œ ์šฉํ•˜๊ฒŒ ์“ธ ์ˆ˜ ์žˆ๋Š” ํ•จ์ˆ˜๊ฐ€ ์žˆ๋Š”๋ฐ์š”. ๋ฌผ๋ก  ์ผ๋ฐ˜์ ์ธ ์ƒํ™ฉ์—์„œ๋„ ์ž์‹ ์ด ์ €์žฅํ•˜๊ณ  ์žˆ๋Š”, ์‹คํ–‰ํ•˜๊ณ  ์žˆ๋Š” ๋””๋ ‰ ํ† ๋ฆฌ๋ฅผ ์•Œ๋ ค๊ณ  ํ• ๋–„ ์‚ฌ์šฉํ•˜๋Š” ๋ช…๋ น์–ด์ธ๋ฐ, ์ด๊ฒƒ์ด ๋ฐ”๋กœ os.path.join() ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ํ•จ์ˆ˜ ์•ˆ์— ๊ฒฝ๋กœ์˜ ๊ฐœ๋ณ„ ํด๋” ์ด๋ฆ„์„ ์ง€์ •ํ•˜๋ฉด ํ•ด๋‹น ๊ฒฝ๋กœ๋ฅผ ๊ฐ ์šด์˜์ฒด์ œ์— ๋งž๋Š” ๊ตฌ๋ถ„ ๊ธฐํ˜ธ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ƒ์„ฑํ•ด์ค๋‹ˆ๋‹ค. import o..