Big Data
Може би е добре да се включи в курса и лекция за Big Data, ако не се направи отделен курс на тази тема.
Целият този бум се дължи на технологиите около Big Data.
Може би е добре да се включи в курса и лекция за Big Data, ако не се направи отделен курс на тази тема.
Целият този бум се дължи на технологиите около Big Data.
Трябва да стане ясно, че ценни и полезни прозрения се получават и при интеграцията на данни от различни източници, които може да са структурирани, полуструктурирани и неструктурирани.
Здравейте,
принципа на работа с данните е същия, са мо сетовете са 'биг'. Дотолкова, че с лаптоп няма смисъл да се правят опити за отваряне и обработка( освен на малки части, което и правим ние ).
Ако има капацитет за отделен курс, ще е голям удар. :)
Направих това предложение, защото мисля, че един съвременен Data Science специалист трябва да е запознат с философията на Big Data. Въпросът не е само в размера на данните. На бъдещите такива специалисти ще им се налага да работят с Hadoop, Spark, Hive и др. Ще трябва да са запознати и с map reduce и т.н. Така, че би било хубаво в такъв курс да им се обърне внимание за тези неща.
Това не е критика към курса, да не бъда разбрана погрешно, а просто предложение за следващи такива курсове.
Привет,
да и аз мисля, че ще е ОК или модул към курса или направо отделен курс за BIG DATA
Тук съм качила книга, която горещо препоръчвам за всички, които искат да натрупат малко обща кулутра по BigData темата, докато се занимават с курса :) Надявам се, че ще ви допадне. Поздрави
https://www.dropbox.com/s/mh8a4d1zq50ipm1/Tom%20White%20-%20Hadoop%20The%20Definitive%20Guide.pdf?dl=0
Много благодаря за книгата!
А ето тук (за всички, които искат да се учат) :
See how beautiful Hadoop can be, live demo Hadoop directly from your Browser!
вие, за да отворите big data..лаптопите ни ще изпушат :Д то като знаеш логиката и какво искаш другото е въпрос на желание. Иначе да и аз заради big data записах този курс и малко време да убия преди следващия от професионалните модули..ST е пълна скука честно.
Честно като гледам повечето им е трудно дори с основните логики не, говорим за синтаксис бързайте с малки стъпки :Д
Еми HDP и Cloudera виртуалките могат и с 8ГБ да се подкарат. Аз съм на 16ГБ и вървят добре. Хайде, Коледа идва, направете си един "професионален" подарък, за който после поне да ви е чиста съвестта :D
Подкрепям идеята за курс за big data. Една лекция е недостатъчна.
Основните концепции са няколко и се въртят около 2 аспекта: 1) processing на части, паралелно; 2) ефективно съхранение.
Има различни библиотеки и технологии, но основната част от big data не е самата обработка на данните, а sysadmin, devops и подобни неща (като cloud services, deployment, availability, data storage and redundancy, security, parallel processing и т.н.). Като цяло е много по-близо до системната администрация и програмирането, отколкото до работата с данни, моделирането и търсенето на информация.
Лично на мен ми харесва повече идеята за обработка, а концепциите там са същите, като тези, които учим в този курс. Sysadmin-ските неща не са за data scientists по принцип. Затова не се интересувам да водя такъв курс.
Ако има голям интерес, ще направя допълнително видео.
P.S.: Книжката на @m_nikolova93 е добра, но big data отдавна не е само Hadoop.
Благодаря, Данчо!