본문 바로가기

데이터베이스(DA, AA, TA)

(146)
[빅데이터] 데이터과학 산책 강의 CHAPTER11-1. 강좌 개요1-2. 데이터와 통계적 분석 절차1-3. 데이터의 정의와 역사1-4. 사례별 데이터 수집 절차 및 데이터 유형1-5. 산업의 발전 단계1-6. 정보 통신 수단의 발달에 따른 데이터 SW 변화1-7. 데이터와 4차 산업 변화 CHAPTER22-1. 데이터 생성/활용 사례2-2. 데이터의 산업체 활용 및 변화2-3. 데이터 현재 모습과 활용도의 변화2-4. 데이터 이용하기 (용도, 분석 절차, 역할)2-5. 빅데이터 활용 사례 CHAPTER33-1. 데이터 분석 개요3-2. 분석 기술의 종류3-3. 데이터 분석의 승패3-4. 회귀 분석 CHAPTER44-1. 군집 분석 정의 및 사례 14-2. 군집 분석 사례 24-3. 단어구름 분석 정의 및 사례 14-4. 단어 구름 사례..
[빅데이터] 검색시스템 간단 요약 검색이란 무엇인가? "책이나 컴퓨터에서 목적에 따라 필요한 자료를 찾아내는 일"검색 시스템 이란 무엇인가? "전자화된 문서로부터 사용자가 원하는 정보"를 찾는 작업을 수행하는 시스템 집합 백그라운드 작업 (수집 / 정제 / 색인): 문서가 새로 생성되고 바뀌므로, 주기적으로 계속 반복해서 일어난다. 리얼타임 작업 (서빙): 사용자가 일회성으로 검색 요청을 보냈을때 응답을 준다. 1) 수집 (전자화된 문서를 모으는 시스템) - 검색할 문서를 수집 - 다양한 문서양식 이해, 문서/사이트 품질 판단 - 수집 시스템 2) 정제 (문서를 검색에 알맞게 가공하는 시스템) - 문서에서 검색에 유효한 부분을 추출하고 가공 - 대규모 데이터 처리, 시스템 가용성 - 저장소 + 정제 플랫폼 + 문서 관리 3) 색인 (가공..
[대용량DB] Sharding & Query Off Loading 출처: http://bcho.tistory.com/670 RDBMS는 크게 request 바로 처리하는 트랜잭션 처리용의 OLTP(On-Line Transaction Processing)성과, 데이터를 모아서 분석하고 리포팅하는 OLAP(On-Line Analytical Processing) 두가지로 분리됩니다. 여기서 설명하는 RDBMS는 OLTP성의 데이터베이스입니다. RDBMS는 2차원 테이블 구조의 데이터를 KEY 값을 중심으로 여러개의 컬럼으로 저장되며, 저장된 각각의 로우(행)은 다른 테이블의 로우와 관계를 가질 수 있습니다. RDBMS를 이요한 설계를 하는데, 고려할만한 아키텍쳐는 성능향상을 위한 Query Off Loading과, Sharding이라는 기법이 있습니다. Query Off L..
[오라클] 트러블 슈팅 팁(1) 트러블의 종류 실제 환경에서 데이터베이스 트러블이 발생하면 원인을 찾아야 합니다. 그런데 어디서부터 어떻게 확인해야 할까요? 일단 데이터베이스와 관련한 트러블(오류) 종류를 크게 나누면 아래와 같습니다. 장애 패턴 패턴 개요 장애 예 사양 오류 애플리케이션 또는 데이터 문제로 발생하는, 데이터베이스 동작은 문제없는 사양의 오류 데이터 문제로 발생하는 오류, 예를 들어 테이블 필드 정의 자릿수보다 큰 숫자 데이터를 저장하려 하면 'ORA-12899: value too large for column'이 발생함. 내부 오류 등 예상 밖의 동작 예상하지 못한 사태로 데이터베이스에 어떤 문제가 발생한 경우의 내부 오류 등 ORA-600, ORA-7445(내부 오류) 또는 아카이브 로그 출력 대상이 DISKFULL..
[오라클] RAC 튜닝 방법(3) - DFS lock handle DFS lock handle DFS lock handle은 요청한 Global lock의 lock handle을 기다리고 있는 대기 이벤트입니다. 이 lock handle은 global lock과 동일합니다. lock handle을 획득하면 global lock을 소유한 상태로 lock conversion이나 lock release와 같은 여러 작업을 수행할 수 있습니다. global lock은 DLM(Distributed Lock Manager)에 의해 관리됩니다. DFS는 Distributed File System의 약자로, 오라클 제품 역사(History)와 관련 있는 용어로 생각됩니다. 오라클 10g의 RAC 기능이 완성되기 전까지 오라클은 상당한 기간동안 분산 데이터베이스를 구현해 왔으며, 최초..