본문 바로가기
  • 당신은 참 괜찮은 사람입니다!
  • 당신은 사랑 받기에 충분합니다!
세상좋은 꿀팁/[정책 지식] 정부의 정책

디지털 뉴딜 핵심 "인공지능 데이터 품질 표준안" 추진!

by 창의날다 2020. 10. 5.

우리는 지금 4차 산업혁명의 시대를 살아가고 있습니다.
디지털 기술, 인공지능, 빅데이터, 클라우드 기술 등 이런 단어와 의미에 대해서 친숙해져야 하는 시기라는 것입니다. 

인공지능 기술 그리고 인공지능 데이터는 이미 우리의 실 생활에서 활용되고 있으며 점점 더 그 범위를 넓혀가고 있습니다.
이러한 현상은 우리나라에만 국한 된 것이 아니라, 코로나19 감염 사태 이후로 급격한 디지털 기술의 발전 그리고 인공지능 기술의 발전으로 세계 대부분의 나라에서 앞다투어 발전하고 있습니다.
아지만 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않아 생활 속 활용성에 대한 정확도가 아직은 떨어지는 부분이 있습니다. 

이에 과학기술정보통신부는 한국정보통신기술협회와 한국정보화진흥원을 통해 기 개발된 인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19)‘을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화하여 이번에 표준안을 개발하게 되었습니다.
표준안에서 인공지능 데이터의 품질을 인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준으로 정의하고 있습니다.
이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우되며 인공지능 기술과 서비스의 성능을 좌우하는 핵심 요소입니다.

앞으로 인공지능 데이터 품질에 대한 표준안에 완성 확정이 된다면 더욱 안전하고 확실한 인공지능 데이터 서비스를 활용할 수 있게 되고, 더욱 많은 인공지능 데이터를 실 생활에서 활용할 수 있게 될 것입니다.
인공지능 분야는 앞으로 무궁하게 발전하고 성과를 이룰 것으로 기대됩니다. 

디지털 뉴딜의 핵심 인공지능 데이터 표준안에 대한 자세한 사항은 과학기술정보통신부에서 보도한 아래의 내용(디지털 뉴딜, '데이터 댐'의 핵심 인공지능 데이터 품질 표준안, 국내외 표준화 추진)을 참고하시기 바랍니다.^^

 

디지털 뉴딜, 「데이터 댐」의 핵심 인공지능(AI) 데이터 품질 표준안, 국내외 표준화 추진

- 「데이터 댐」 데이터 품질 개념·범위·세부 요구사항 마련 -
- 10월 6일, 정보통신 단체표준화(TTA) 착수, 국제표준안으로도 제안 예정 -

 

과학기술정보통신부(장관 최기영, 이하 과기정통부’)는 디지털 뉴딜 데이터 댐의 핵심자원인 인공지능(AI) 데이터 관련 품질의 개념과 범위, 세부 요구사항 등을 정립한 표준안을 개발하고,

한국정보통신기술협회(TTA) 단체표준으로 만들기 위해 106일 한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술)에 공식제안하였고, 관련 전문가 등의 의견수렴 절차를 거쳐 내년 6월에 최종 채택·확정될 것으로 전망된다.

또한, 앞으로 관련 내용을 국제표준화 성과로도 이어질 수 있도록 추진할 계획이다.

 

이번 표준안에서 인공지능 데이터의 품질을 인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준으로 정의하였고,

이는 데이터가 적정한 절차와 요구사항, 규격 등으로 처리되는지에 따라 좌우되며 인공지능 기술과 서비스의 성능을 좌우하는 핵심요소이다.

하지만, 아직 세계적으로 품질 수준이 높지 않은 상황이다. 예를 들어, 세계적 정보통신기술 기업들인 마이크로소프트나 구글 등이 4~6년 넘게 구축·업데이트해온 유명한 개방 데이터셋의 경우에도 데이터 정확도가 43~83% 수준에 불과하다.
* '14년 구축 시작된 MS COCO, '16년 구축 시작된 Google Open Images의 현재 라벨링 정확도(재현율-라벨링해야 하는 사물 중 라벨링된 비율)83%, 43%에 불과

이는 아직 세계적으로 인공지능 데이터 품질에 대한 체계적인 방법론이 정립되지 않은 것이 중요한 원인으로 분석된다.

특히, 지난 4월 우리나라가 인공지능 국제표준화회의(ISO/IEC JTC1/SC42)*’에 인공지능 데이터(딥러닝) 품질 관련 사항을 신규 과제로 제안하여 채택되는 등 이제 막 논의가 시작되는 초기단계이다.
* 국제표준화기구(ISO)와 국제전기기술위원회(IEC)가 정보기술 분야 국제표준화를 위해 운영 중인 합동기술위원회(JTC 1)의 인공지능 분과위원회

 

이에 한국정보통신기술협회와 한국정보화진흥원을 통해 기 개발된 인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19년)‘을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화하여 이번에 표준안을 개발하게 되었다.

표준안은 자연어처리, 자율자동차, 의료, 농축수산, 제조 등 다양한 분야에서 공통적으로 적용 가능한 범용표준의 형태로 개발되었으며,

데이터의 품질을 체계적으로 확보하고 상호호환성을 제고할 수 있도록 데이터 수집정제가공품질검증활용 등 전주기 단계별로 필요한 표준절차와 품질 요구사항 등을 정의하고 기본적인 데이터 규격을 담고 있다.

구체적으로는
△ 원시데이터 수집단계의 다양성, 사실성 등의 품질 요구사항과 파일 포맷, 해상도 등의 기술 적합성 요구사항,
△ 정제단계의 데이터 중복방지 및 비식별화 조치 요구사항,
△ 가공단계의 객체 분류체계 및 라벨링 규격 요구사항,
△ 품질검수·활용 단계의 유효성 등 검수 요구사항·
방법 등으로 구성되어 있다.

 

과기정통부는 이번에 개발된 표준안을 이미 추경사업 과제(10대 분야, 150종 데이터)에 적용하고 있으며,

한국정보통신기술협회 내의 단체 표준화 기구(TTA PG 1005, 인공지능기반기술) 내의 산··연 전문가 의견수렴을 거쳐 신속하게 단체 표준화를 추진하고,

앞으로 관련 사항을 국립전파연구원 등을 통해 인공지능 국제표준화회의(ISO/IEC JTC1/SC42)’에 제안하는 등 국제표준화의 성과로 이어지도록 할 계획이다.

아울러, 올 연말까지 표준안을 바탕으로 인공지능 개발자, 공공기관 관계자 등이 인공지능 데이터의 품질을 보다 체계적으로 계획·관리할 수 있도록 하기 위해 자세한 설명 등을 포함하는 인공지능 데이터 품질관리 가이드를 개발·배포할 계획이다.

 

과기정통부는 이번에 개발된 표준안이 디지털 뉴딜 데이터 댐의 핵심자원인 인공지능 데이터의 품질을 향상시키고, 나아가 국가 전반의 인공지능 기술과 서비스의 성능을 높이는데 크게 기여할 것으로 기대하며,

앞으로 국제표준화를 선도하고 우리나라가 인공지능 강국으로 도약하는데 더욱 노력할 계획이다.

 

<알아두면 유익한 정보~~^^>

☞ '자동차정기검사, 자동차등록증 제출폐지" 외 규제제도 30개 개선추진!

☞ "청약제도 개선" 민영주택 생애최초 특별공급 신설, 신혼부부 소득기준 완화!

☞ 그린뉴딜 신재생에너지 공급의무, 보급 활성화 한다!

☞ 차세대 지능형 반도체 "인공지능 반도체" 기술개발 팀 출범!

 

인공지능 데이터 품질 표준안 – 요약본

 

□ 인공지능 데이터 품질 개념

(정의) 인공지능 기술(모델 및 알고리즘)에 활용되는 데이터가 다양성, 정확성, 유효성 등을 확보하여 사용자에게 유용한 가치를 줄 수 있는 수준

(범위) 데이터 구축 전 단계에 적용되며, 품질관리 대상을 데이터 자체의 품질관리(Data-Oriented Quality, 일반 요구사항)와 구축 과정의 품질관리(Process-Oriented Quality, 구축 요구사항)로 구분

 

□ 주요 품질 요구사항

(데이터 요구사항) 품질관리 대상이 되는 데이터 상태에 따라 원시데이터, 데이터 라벨링, 인공지능 활용 품질 요구사항으로 구분

ㅇ (구축절차 요구사항) 품질관리가 수행되어야 하는 데이터 구축 단계에 따라 데이터 획득, 정제, 라벨링, 품질검수 및 활용 품질 요구사항으로 구분

 

본 저작물은 과학기술정보통신부에서 ‘20작성하여 공공누리 제1유형으로 개방한 인공지능(AI) 데이터 품질 표준안, 국내외 표준화 추진(작성자:인공지능데이터팀)’을 이용하였으며, 해당 저작물은 과학기술정보통신부 홈페이지(www.msit.go.kr/web/main/main.do)’에서 무료로 다운받으실 수 있습니다.


** 항상 유익하고 행복한 이야기를 나누기 위해 노력합니다.^^*
** 함께 하는 행복을 누려요~~ 구독과 공감 댓글 클릭~~ 서로 소통해요^^v
** 오늘도 행복하시고, 모두 힘내세요~~ 감사합니다.

728x90

댓글