RDB
: 관계형 데이터 베이스
- MySQL
- MSSQL
- MariaDB
- Oracle
- PostgreSQL
- Aurora
NoSQL
: RDB가 아닌 데이터 베이스
유동적인 데이터 모델링이 가능하다.
수평적 확장을 하는 형태이므로 대용량 데이터를 성능 이슈 없이 사용할 수 있다.
NoSQL 저장형태
- Key-Value형
- DynamoDB
- Redis
- Document형
- MongoDB
- Elasticsearch
- CouchDB
- Wide Column형
- Cassandra
- HBase
- Graph형
- Neo4j
- Neptune
- Realtime형
- Firebase
- RethinkDB
Data Warehouse
: 여러 소스에 있는 데이터를 조합하여 분석하기 위한 데이터 저장소
: 분석용 데이터를 모아놓은 중앙 데이터베이스
- Snowflake
- Presto
- Hive
- Redshift
- BigQuery
Data Processing
: 데이터 처리하는 방식
- Batch 방식
- Apache Pig
- data build tool
- Hybrid 방식 - Batch + Streaming
- Spark
- Flink
- Streaming 방식
- Kafka
- Kinesis
CI/CD
CI: 소스 코드의 빌드, 테스트, 병합
CD: 서비스 환경까지 릴리즈 되는 것
-> 핵심은 이 과정들을 자동화 하는 것
- GitHub Actions
- Jenkins
- AWS CodePipeline(CodeBuild + CodeDeploy)
데이터 분석가 로드맵
참조
728x90
반응형
'DATA' 카테고리의 다른 글
MongoDB란? windows 설치하기 / Studio 3T, Compass 사용하기 (0) | 2022.12.24 |
---|---|
[Fastcampus 데이터 엔지니어링] 데이터 엔지니어는 어떤 언어를 배워야 할까? (0) | 2022.12.03 |
[올윈에듀] 인공지능 기술과 산업별 실무적용 기법 (0) | 2022.10.26 |
SEO 검색 최적화 하는 방법 (0) | 2022.06.24 |
Hadoop & Hbase & Hive 란? (0) | 2022.06.07 |
댓글