Курс по научни данни

Общ преглед

24 locations available

Описание на програмата

умения

Използвайте Python, за да монтирате набори от данни и да предскажете модели.

Стандарт за производство

Изграждане на статистически модели - регресия и класификация - които генерират използваема информация от необработени данни.

Голямата картина

Учи основите на машинното обучение и използва силата на данните, за да прогнозира какво следва.

Запознайте се с екипа си за поддръжка

Нашите образователни постижения са общностно усилие. Когато се обучавате в GA, винаги можете да разчитате на екип от експерти, който да ви предостави насоки и поддръжка, когато имате нужда от тях.

инструктори

Научете рамки, инструменти, речници и най-добри практики в индустрията от учител, чиято ежедневна работа включва използването им експертно.

Асистенти за преподаване

Поемането на нов материал не винаги е лесно. Чрез часовете за работа и други канали нашите ТК са тук, за да ви дадат отговори, съвети и др.

Производители на курсове

Нашите възпитаници обичат своите производители на курсове, които ги държат мотивирани по време на курса. Можете да се свържете с вашите за подкрепа по всяко време.

Вижте какво ще научите

Раздел 1: Изследователски дизайн и анализ на проучвателни данни

  • Какво е Data Science
    • Опишете курсовата програма и установете средата в класната стая
    • Отговорете на въпросите: "Какво е науката на данните? Какви роли съществуват в науката за данни?"
    • Определете работните потоци, инструментите и подходите, които изследователите използват, за да анализират данните
  • Изследователски дизайн и панда
  • Определете проблем и идентифицирайте подходящи набори от данни, като използвате работния процес на науката за данни
  • Разглеждане на работния поток от данни, използвайки казус в библиотеката на Pandas
  • Импортирайте, форматирайте и чистите данни, използвайки библиотеката Pandas
  • Основни статистически данни I
  • Използвайте NumPy и Pandas библиотеки, за да анализирате набор от данни, като използвате основни статистически данни: средно, средно, режим, максимум, мин, квартил, между квартили, диапазон, вариация, стандартно отклонение и корелация
  • Създаване на визуализация на данни - разсейване на графики, матрица на разсейване, линейна графика, кутии и хистограми - за разпознаване на характеристиките и тенденциите в даден набор от данни
  • Определете нормалното разпределение в даден набор от данни, като използвате обобщена статистика и визуализация
  • Основни статистически данни II
  • Обяснете разликата между причинно-следствената връзка
  • Изпробвайте хипотезата в примерното проучване
  • Утвърдете вашите открития чрез статистически анализ (p-стойности, доверителни интервали)
  • Избор на инструктор
  • Фокусирайте се върху темата, избрана от инструктора / класа, за да дадете по-задълбочен поглед върху анализа на проучвателните данни

Урок 2: Основи на моделирането на данни

  • Въведение в регресията
    • Определете моделирането на данни и линейната регресия
    • Разграничаване на категорични и непрекъснати променливи
    • Изградете модел на линейна регресия, като използвате набор от данни, който отговаря на предположението за линейност, използвайки библиотеката Scikit-Learn
  • Оценка на модела
  • Дефинирайте метрики за регулиране, пристрастия и грешки;
  • Оценявайте пригодността на модела, като използвате функциите за загуба, включително средната абсолютна грешка, средната квадратна грешка, средната квадратна грешка
  • Изберете регресионни методи въз основа на прилягане и сложност
  • Въведение в класификацията
  • Определете модел за класификация
  • Изградете K-Най-близки съседи, използвайки библиотеката Scikit-Learn
  • Оценявайте и настройвайте модела, като използвате показатели като точност на класифицирането / грешка
  • Въведение в логистичната регресия
  • Изградете модел за класификация на логистичната регресия, използвайки библиотеката Scikit Learn
  • Опишете сигмоидната функция, коефициентите и коефициентите на коефициентите и как те се отнасят до логистичната регресия
  • Оценявайте модел, като използвате показатели като точност на класифицирането / грешка, объркваща матрица, криви ROC / AOC и загуба
  • Комуникирайте резултатите от логистичната регресия
  • Обяснете компромис между прецизността и изземването на модела и изяснявайте цената на фалшивите позитиви срещу фалшивите негативи.
  • Идентифицирайте компонентите на кратък, убедителен доклад и как те се отнасят към конкретни аудитории / заинтересовани страни
  • Опишете разликата между визуализацията за презентации и анализ на проучвателните данни
  • Гъвкава сесия на клас
  • Фокусирайте се върху темата, избрана от инструктора / класа, за да дадете по-задълбочен поглед върху моделирането на данни

Урок 3: Науката на данните в реалния свят

  • Дървета за решения и случайна гора
    • Опишете разликата между класификационните и регресионните дървета и как да интерпретирате тези модели
    • Обяснете и съобщете компромисите на дърветата за решения срещу регресионните модели
    • Изградете дървета за вземане на решения и произволни гори, като използвате библиотеката Scikit-Learn
  • Езикова обработка по естествен език
  • Демонстрирайте как да токенизирате текста на естествения език, използвайки NLTK
  • Категоризирайте и маркирайте неструктурираните текстови данни
  • Обяснете как да създадете модел за класифициране на текст, като използвате NLTK
  • Намаляване на величината
  • Обяснете как да направите намаление на размерите, като използвате модели на темата
  • Демонстрирайте как да прецизирате данните, като използвате латентно разпределение на дирихлетите (LDA)
  • Извличайте информация от примерния текстов набор от данни
  • Работа с данни от серията по време
  • Обяснете защо данните от динамичните редове са различни от другите данни и как да ги отчитате
  • Създайте средства за преобръщане и пресмятате данни от динамични серии, използвайки библиотеката на Pandas
  • Извършвайте автокорелация на данни от времеви редове
  • Създаване на модели с данни от серия от данни
  • Разлагайте данните от динамичните редове в тенденции и остатъчни компоненти
  • Потвърдете и кръстосано потвърдете данни от различни набори от данни
  • Използвайте модела ARIMA, за да прогнозирате и откривате тенденциите в данните от времеви редове
  • Стойността на базите данни
  • Опишете случаите на използване за различни видове бази данни
  • Обяснете разликите между релационни бази данни и бази данни на базата на документи
  • Напишете прости селектирани заявки, за да изтеглите данни от база данни и да ги използвате в рамките на Pandas
  • Преместване напред с вашата кариера в областта на научните данни
  • Посочете общи модели, използвани в различни отрасли
  • Определете случаите на използване на общи модели
  • Обсъдете следващите стъпки и допълнителни ресурси за учене на данни
  • Гъвкава сесия на клас
  • Фокусирайте се върху темата, избрана от инструктора / класа, за да дадете по-задълбочен поглед върху науката за данни в реалния свят
  • Финални презентации
  • Представяне на крайната презентация на връстници, инструктори и гости, които ще идентифицират силните страни и областите за подобрение

Възможности за финансиране

Нуждаете се от помощ при плащане? Нашите възможности за финансиране ви позволяват да се съсредоточите върху целите си вместо върху бариерите, които ви пречат да ги достигнете.

WeLend

Кандидатствайте за безлихвен заем до 18 месеца или за фиксиран заем до 48 месеца⁵Трябва да бъде гражданин на Хонконг или постоянно пребиваващ.
Възможностите за финансиране са различни за всеки пазар и са достъпни само за студенти, приети в нашите програми.
Свържете се с местен служител по признаването за повече информация.

Последна актуализация Март 2020

За учебното заведение

General Assembly is a pioneer in education and career transformation, specializing in today’s most in-demand skills. The leading source for training, staffing, and career transitions, we foster a flou ... Научете повече

General Assembly is a pioneer in education and career transformation, specializing in today’s most in-demand skills. The leading source for training, staffing, and career transitions, we foster a flourishing community of professionals pursuing careers they love. Свиване
Ню Йорк , Атланта , Остин , Бостон , Чикаго , Далас , Денвър , Лос Анжелис , Санта Моника , Ървайн , Ню Йорк , провидение , Сан Франциско , Сан Хосе , Сиатъл , Вашингтон , Арлингтън , Лондон , Хонг Конг , Сингапур , Бризбейн , Мелбърн , Сидни , САЩ онлайн + 23 Още По-малко