Det pågår flera teknikskiften just nu. Ett av dem är att flera vågar lämna de traditionella enterprise lösningarna för att hitta vägen via open source. Det finns flera anledningar, de första är den enklaste att identifiera: Det blir billigare. Men det finns andra värdeökningar att ta i beaktning som flexibla produkter, ihärdigt och kreativt utvecklande och ofta väldigt snabb support.
En fara idag är att låsa in sig i ett teknikhörn. Utvecklingen går snabbt och det gäller att hålla dörrarna öppna åt alla håll. Ingen vet varifrån nästa kurvboll kommer.
Nu inser många att open source är jättestort fält där många blomster prunkar i faunan. Vad ska man välja? När det gäller big data har vi på Middlecon valt att fokusera på Apache’s Hadoop. Det är byggt för att hantera gigantiska mängder data, är otroligt skalbart och vi VET att det går snabbt. I en av våra egna tester har vi ställt analytiska frågor på tabeller med flera miljarder rader och fått svar tillbaka på under sekunden.
Hadoop utvecklas i rasande fart när många fristående utvecklar mot samma källa. ”Gamla företag” kommer få svårt att hålla steget före när så många utvecklare jobbar samtidigt.
Det är en jättestor fördel.
Till och från stöter man på aktörer som gärna viftar med varnande fingrar och menar att man förlorar datakvalitén när man fokuserar på analyshastighet. Som tur är finns det flera alternativ för kvalitetssäkring inom open source.
The Next Generation of Hadoop-Based Security & Data Governance – Hortonworks
Här ser vi hur exempelvis Hortonworks jobbar med sitt Data Governance Initiative, bland annat med Apache Atlas och Ranger. Tillsammans gör de att man kan implementera bättre säkerhetsrutiner kring data baserat på klassificering och roller. Tillsammans bilder Atlas och Ranger en flexibel säkerhetslösning som kan anpassas till ett företags specifika behov.
Framtiden kommer ge Hadoop ännu mera livskraft när machine learning, automatisering och molnlösningar ökar potentialen för de stora oceanerna data. För dig som letar alternativ finns flera, här finns några av dem.
http://data-informed.com/how-to-choose-a-commercial-hadoop-distribution-in-2017/