Anonim
GaudiLab / Shutterstock

Hadoop, ein Apache-Open-Source-Software-Framework zum Speichern und Knabbern von großen Datenmengen über mehrere Maschinencluster hinweg, hat die Nase vorn. Märkte und Märkte prognostizieren im Januar 2017, dass der Hadoop-Markt bis 2021 auf mehr als 40 Milliarden US-Dollar wachsen könnte. Diese Prognosen werden allmählich pessimistisch, da sich die globalen Märkte 2018 voraussichtlich stetig verbessern werden und der Big-Data-Markt wird bis 2022 auf über 99 Milliarden US-Dollar wachsen (was einer prognostizierten Wachstumsrate von 28, 5% entspricht).

Eines ist jedoch sicher: Das Wachstum in einem derart enormen Ausmaß erfordert dringend viel leistungsfähigere IT-Experten für die Entwicklung, Verwaltung und Verwaltung von Hadoop-Implementierungen.

Angesichts der Zeit und der Vorliebe für das Thema haben viele Fachleute das Gefühl, dass Sie im Selbststudium lernen können, was Sie über Hadoop wissen müssen. Für diese Leute ist das Durchsuchen der zahlreichen Dokumentationen auf der Apache Hadoop-Website ein guter Ausgangspunkt. Sie können auch die Open-Source-Version von Hadoop herunterladen und die Gelegenheit nutzen, einige Knöpfe zu drehen und Hadoop in Ihrem eigenen Tempo zu erkunden.

Administratoren und Entwickler, die eine strukturiertere Lernerfahrung bevorzugen, können kostenlose Online-Schulungen nutzen, um schnell auf den neuesten Stand zu kommen.

Hadoop Online-Schulung

In keiner bestimmten Reihenfolge finden Sie hier mehr als ein Dutzend großartiger kostenloser Quellen für Hadoop-Schulungen.

CognitiveClass.ai war früher eine Big Data-Universität und bietet mehr als 50 Kurse zu den Themen Hadoop, HBase, Pig, Big Data Analytics, SQL, IBM BLU, DB2 und mehr an, die alle in Ihrem eigenen Tempo verfügbar sind.

Sie finden auch zwei Lernpfade zum Erlernen der Hadoop-Grundlagen für Anfänger und Hadoop-Programmierung für fortgeschrittene Hadoop-Anwender.

Sie bieten auch eine breite Palette an virtuellen Labors, in denen die Schüler üben können, was sie lernen. Die meisten Kurse sind auf Englisch, einige auf Japanisch, Spanisch und Russisch. BigDataUniversity betreibt weiterhin portugiesische (.br) und mandarinische (.cn) Websites.

2. Cloudera Essentials für Apache Hadoop

Cloudera hat einen Online-Videokurs zu Cloudera Essentials für Apache Hadoop, der Kapitel für Kapitel verteilt wird. An der Cloudera University finden Sie Hadoop-Schulungen für Administratoren, Datenanalysten, Datenwissenschaftler, Entwickler und Sicherheitsexperten.

Ihr nächster Schritt könnte der dreistündige Einführungskurs in Hadoop und MapReduce sein, der über Udacity angeboten wird. Cloudera verfügt auch über eine SQL Analytics-Workbench mit dem Namen HUE, mit der Unternehmen ihre eigenen Self-Service-Abfragen erstellen können. Dies ist auch ein hervorragendes Lernwerkzeug, um die Hadoop-Umgebung kennenzulernen.

3. Coreservlets.com

Coreservlets.com verzichtet auf Glanz und Glamour und bietet eine Reihe von Tutorials zur Entwicklung von Big-Data-Anwendungen mit Hadoop, die über eine direkte textbasierte Oberfläche bereitgestellt werden.

In jedem Tutorial-Abschnitt können Sie PDFs und / oder Diashows nachvollziehen. In einigen Fällen erhalten Sie jedoch auch herunterladbare virtuelle Maschinen sowie Übungen (mit Lösungen).

Coursera verfügt über eine große Bibliothek an Kursen, die in Zusammenarbeit mit mehreren führenden Universitäten wie der UC San Diego, Stanford, Duke und vielen anderen angeboten werden.

Laut Unternehmensrichtlinie können Sie in allen Kursen kostenlos auf Videovorträge und bestimmte nicht bewertete Aufgaben zugreifen. Diese Vorschau gibt Ihnen die Möglichkeit zu entscheiden, ob Sie einen Kurs kaufen möchten (Preis zwischen 29 und 99 US-Dollar) und möglicherweise weiterhin ein Zertifikat abschließen möchten.

Die Coursera-Suchmaschine bietet 46 Treffer für Kurse, in denen Hadoop erwähnt wird, einschließlich aller Arten von Big Data- und Data Science-Themen, sowie eine UCSD-Klasse mit dem Titel Hadoop Platform and Application Framework.

5. edX

Ähnlich wie Coursera bietet edX Kurse von bekannten Universitäten sowie von High-Tech-Unternehmen und anderen Anbietern an. Geben Sie auf der Hauptwebseite "hadoop" in das Suchfeld ein, um zu sehen, was aktuell verfügbar ist.

Sie können einen edX-Kurs kostenlos auditieren und alle Aufgaben und Prüfungen abarbeiten, aber nur bezahlte Teilnehmer erhalten ein Abschlusszertifikat. Derzeit bietet edX sieben Kurse zu Hadoop an, die alle das Framework und die Plattform abdecken. Drei davon erwähnen Hadoop tatsächlich im Kurstitel.

6. DeZyre

Mit DeZyre können Sie sich von Branchenexperten über Big Data und Hadoop informieren, sich beraten lassen und Projekte abschließen - gegen eine Gebühr. Die kostenlosen Tutorials des Unternehmens sind jedoch jederzeit für jedermann verfügbar.

Durchsuchen Sie die lange Liste der Tutorials auf der Seite mit den DeZyre-Tutorials und klicken Sie auf alles, was Ihr Interesse weckt - es ist keine Anmeldung erforderlich. Es gibt mehr als 18 Kurse auf dem Gelände, von denen zwei kostenlos sind.

7. Hortonworks

Hortonworks bietet zahlreiche kostenpflichtige Kurse sowie kostenlose Hadoop-Schulungen und -Anleitungen. Für die meisten Lernprogramme müssen Sie die Hortonworks Sandbox herunterladen und installieren. Das Unternehmen empfiehlt andere Lernprogramme als Voraussetzung, um sicherzustellen, dass Sie bereit sind, möglichst effizient zu lernen.

Als Begründer der Hadoop-Technologie bietet Hortonworks eines der umfassendsten und angesehensten Portfolios an Hadoop-Schulungen.

8. IBM developerWorks

IBM developerWorks bietet kostenlose Lernprogramme und Tools für Big Data-Analysen, Cloud Computing und andere High-Tech-Kategorien, die auf IBM Technologien basieren. Beispiel: Wählen Sie IBM Open Platform für Ihre Hadoop- und Spark-Projekte und untersuchen Sie die Apache Hadoop- und Apache Spark-Distribution. Unterwegs wird der Zweck oder die Funktion jeder Komponente beschrieben, z. B. Spark, MapReduce, Sqoop und mehr.

Open Source Big Data für den Ungeduldigen ist ein solides Tutorial, das Sie durch die Grundlagen von Big Data und Hadoop führt. Sie haben ein Hadoop-Image heruntergeladen (Cloudera wird empfohlen), um Beispiele für Hadoop, Hive, Pig, Oozie und Sqoop durchzuarbeiten.

9. Hadoop-Online-Tutorials.com

Die von Anil Jain verwaltete Website für Hadoop-Schulungen und -Tutorials bietet Links zu gebrandeten (kostenpflichtigen) Schulungen sowie kostenlose Online-Tutorials und Verweise auf empfohlene Bücher zu Hadoop.

Einige der kostenlosen Ressourcen, die Jain erwähnt, werden in diesem Blogbeitrag vorgestellt, aber hier finden Sie andere, die auf jeden Fall einen Blick wert sind.

10. MapR Technologies

MapR ist der Anbieter einer führenden Apache Hadoop-Distribution. Die On-Demand-Hadoop-Schulungen des Unternehmens umfassen Videokurse, Labore, praktische Übungen und vieles mehr und können zur Zertifizierung als MapR Certified Cluster Administrator (MCCA), Data Analyst (MCDA) oder Certified Hadoop Developer (MCHD) führen.

MapR bietet derzeit Apache Hadoop Essentials, sechs verschiedene Cluster Administration-Kurse, drei Hadoop Developer-Kurse und viele weitere On-Demand-Kurse an, die HBase, MapR Streams, Apache Spark, Apache Drill und Apache Hive abdecken.

Auf der On-Demand-Schulungsseite finden Sie eine vollständige Liste der Kursangebote.

11. Udacity

Udacity ist bekannt für seinen Katalog von Schulungen zu Datenwissenschaft, Webentwicklung, Softwareentwicklung und mobilen Betriebssystemen, die von Silicon Valley-Größen wie Facebook und Twitter, Cadence und vielen anderen entwickelt wurden. Es bietet kostenlose Kurse und Kursmaterialien an. Sie müssen sich jedoch für ein kostenpflichtiges Programm anmelden, um einen Nanodegree-Berechtigungsnachweis zu erhalten.

Um alle kostenlosen Kurse auf einen Blick zu sehen, rufen Sie die Seite Kurse und Nanodegree-Programme auf und aktivieren Sie das Kontrollkästchen Kostenlose Kurse im Bereich Filter. Derzeit werden bei einer Suche in Hadoop drei Klassen gefunden: zwei in Hadoop selbst und eine weitere in Echtzeitanalysen mit Apache Storm.

12. Udemy

Udemy bietet mehr als 40.000 kostenlose und kostenpflichtige Kurse zu fast allem unter der Sonne an. Wenn Sie zur Startseite gelangen, geben Sie "Hadoop free" in das Suchfeld ein, um zu sehen, was gerade angeboten wird.

Derzeit finden Sie mehr als 35 Kurse mit jeweils fünf bis mehr als 60 Vorlesungen, die sich hauptsächlich an Anfänger bis Fortgeschrittene richten. Alle erwähnen spezifisch und ausführlich Hadoop.

13. Microsoft Virtual Academy

Das Microsoft Professional Program (MPP) bietet unter anderem eine Vielzahl von Zertifikaten in den Bereichen Big Data und Data Science an.

Zu den angebotenen Kursen gehören das Verarbeiten von Big Data mit Azure HDInsight (der von Microsoft verwalteten Hadoop-Distribution, die in der Azure-Cloud ausgeführt wird), das Verarbeiten von Echtzeitdaten mit Azure HDInsight und das Implementieren von Predictive Analytics mit Spark in Azure HDInsight. Für benotete Tests und ein Zertifikat ist eine Gebühr von 99 USD erforderlich.

14. YouTube

Wie zu erwarten, verfügt YouTube über eine lange Liste von Hadoop-Schulungsvideos. Suchen Sie auf der Hauptseite nach Hadoop, stöbern Sie in den über 100 Ergebnissen und wählen Sie einige Videos aus, die genau zu Ihnen passen.

15. Hadoop-Benutzer LinkedIn-Gruppe

Es gibt auch großartige Informationen zu Hadoop-Schulungsressourcen, die von Mitgliedern der LinkedIn-Gruppe der Hadoop-Benutzer ausgetauscht werden. Wenn Sie LinkedIn Learning besuchen und nach Hadoop suchen, werden derzeit nicht weniger als 297 Treffer angezeigt. Tolles Zeug!