Rules
1. 참가 자격
- 국내외 대학 학부 재학생 또는 휴학생 (전공 및 학년 제한 없음).
- 상금은 대표자 명의로 된 국내 은행 계좌로만 지급 가능.
- 참가 신청시 재학증명서를 같이 제출해야 함. (대회 시작일로부터 1개월 이내 발급본)
- 참가 자격 관련 추가 문의는 담당자에게 문의 바람.
2. 참여 규칙
- 개인 또는 팀(최대 4인) 으로 참여 가능.
- 참가 신청시 팀을 결성하여 신청하여야 하며, 신청 후 팀을 합치거나 나누는 것은 불가능함 (적발시 실격).
- 동일인의 다계정 참가 등록은 금지되며, 적발 시 팀 전체 실격 처리.
3. 모델 학습·추론 및 외부 자원 사용 규칙
3.1 사용 환경
- 사용 언어: Python
- 모든 모델은 인터넷이 차단된 로컬 환경(CPU 또는 GPU)에서 실행가능해야 함.
3.2 외부 API 사용
- 학습 및 추론 과정에서 외부 상용 API(예: ChatGPT, Gemini, Grok 등) 사용을 금지함.
- 데이터 전처리 목적에 한해 외부 상용 API 사용을 허용하되, 총 사용 비용은 3만 원을 초과할 수 없음.
- 외부 API를 활용한 경우, 발표 자료에 해당 API의 사용 방식, 실험 결과 및 발생 비용을 명시해야 함.
- 평가 과정에서 총 구축 비용이 3만 원을 초과한 것으로 판단될 경우 실격 처리될 수 있음.
3.3 데이터 및 모델
- 모델 학습 시 외부 데이터 사용을 금지하며, 제공된 학습 데이터만 사용할 수 있음.
- 오픈소스 모델(예: LLaMA 등)은 활용 가능하나, 2026년 5월 31일 이전에 모델 가중치가 공개된 경우에 한함.
- 허용 여부가 불확실한 경우 Kaggle Discussion 탭을 통해 운영진에게 사전 문의할 것.
- 모델 앙상블은 허용하지 않음.
- 모델 경량화 기법(예: Quantization, LoRA 등)은 허용함.
- 추론 전략 및 중간 추론 표현 방식(예: Chain-of-Thought, Multi-turn Chat 등)은 제한 없이 활용 가능함.
- 테스트 셋 전체에 대해 검증 환경 (“4. 제출 규칙” 참조) 에서 24시간 이내에 추론이 완료되어야 함.
3.4 데이터 누수
- 평가 데이터셋 정보를 학습에 활용하는 행위(데이터 누수, Data Leakage)는 금지함.
- 예: 평가 데이터에 대한 수작업 라벨링 후 학습에 활용
- 예: 평가 데이터의 특성을 분석하여 학습 데이터 전처리 또는 모델 설계에 활용
- 위반 시 실격 처리함.
3.5 규칙 위반
- 규칙을 준수하지 않을 경우 실격 처리될 수 있음.
- 대회 진행 중에도 리더보드 상위 참가자를 대상으로 코드 및 결과에 대한 재현성 검증을 요청할 수 있음.
4. 제출 규칙
- 제출은 1일 2회로 제한.
- 최종 제출 모델은 NVIDIA RTX 3090 GPU(VRAM 24GB) 1개를 이용하여 실행 가능해야 함.
- 서버 사양 상세
- CPU: AMD EPYC 7502 32-Core Processor x 2
- Memory: 512 GB
- GPU: GeForce RTX 3090
- NVIDIA driver version: 550.54.15
- CUDA version: 12.4
5. 예선 평가 규칙
- 예선기간 중 리더보드는 전체 테스트 데이터의 70% (Public data)만을 이용하여 업데이트됨. 순위는 Exact Match Accuracy를 기준으로 결정.
- 제출한 이미지 순서가 정답 순서와 완전히 동일한 경우에만 정답으로 인정되며, 순서가 하나라도 다를 경우 오답으로 처리.
- 예) 정답이 [1, 4, 2, 3]일 때, [1, 4, 2, 3]만 정답으로 처리되며 그 외의 모든 순서는 오답으로 간주.
- 예선 종료 후 테스트 데이터 전체 (Public + Private data)에 대한 모델 성능 기준 상위 순위팀을 대상으로 코드 검증 및 보고서 검토를 수행.
- 참가팀들의 성능 달성 수준에 따라 예선 종료 후 외부 데이터셋을 기반으로 한 성능 평가가 별도로 진행될 수 있습니다.
6. 코드 재현성 검증 및 보고서 제출 관련 사항
- 예선 종료 후 상위 16위 이내 참가자는 지정된 기한 내에 아래 자료를 제출해야 함.
- 학습 코드 및 추론 코드 (.py 형태)
- 최종 모델 가중치 파일
- 과제 해결을 위해 사용한 방법론을 보고서 형태로 정리 (A4 5쪽 이내 분량, MS 워드 파일로 제출하고 별도 양식은 없음.)
- 제출 코드 관련 준수 사항:
- README.md 파일을 상세히 작성할 것
- 데이터 입·출력 경로는 상대 경로로 표기할 것
- 코드 및 주석 인코딩은 UTF-8로 통일할 것
- 모든 코드는 오류 없이 실행되어야 함
- 개발 환경(OS, 하드웨어 사양) 및 라이브러리 버전을 명시할 것
- 추론(Inference) 코드는 별도로 작성하고, 사용된 모델 가중치 파일을 함께 제출할 것.
- 모델 구동 코드 및 가중치를 포함한 전체 모델의 크기는 80 GB를 초과하여서는 안 됨.
- 상세한 절차는 추후 별도 안내
7. 본선 발표 자료 제출
- 코드 재현성 검증을 통과한 예선 점수 상위팀들을 대상으로 오프라인 발표 평가를 진행함.
- 발표 자료는 발표 전날까지 PPT 또는 PDF 형식으로 제출할 것.
- 발표는 10분 이내 분량으로 준비.
8. 본선 발표 규칙
- 본 발표 10분, 질의응답 5분으로 진행됨.
- 발표는 기 제출된 발표자료를 이용하며, 진행하며 주최측에서 발표자료를 세팅할 예정.
- 팀별 대표자가 발표하는 것을 원칙으로 함.
- 팀원 전체가 본선 발표 행사에 참석하여야 함.
- 발표는 공개 발표로 진행함.
※ 규칙이 추가될 수 있으니 수시로 확인하시어 불이익을 받는 일이 없도록 해주시기 바랍니다. (최종 업데이트: 6월 15일 18:00)