Apache Hadoop이란 무엇입니까?

Apache Hadoop 은 Apache Software Foundation에서 만든 대규모 데이터 알고리즘, 분산 저장소 및 분산 처리 소프트웨어 세트의 이름입니다. 대용량 데이터 서비스 애플리케이션을 지원하도록 설계되었습니다. 서비스 손실없이 하드웨어 오류를 자동으로 처리합니다.

Hadoop은 HDFS로 알려진 분산 파일 시스템과 MapReduce라는 대형 데이터 세트를 처리하는 소프트웨어를 사용합니다. 대용량 파일은 일반적으로 64MB 또는 128MB로 분할됩니다. 이 소프트웨어는 대부분 Java로 작성되었으며 일부 하위 레벨 코드는 C로 작성됩니다.

아파치 서버, 빅 데이터, 서비스, 소프트웨어 용어