본문 바로가기

전체 글37

KG생성 새방향 (시퀀스, 유효성, 잠재변수) 지식그래프 생성은 “트리플 하나 맞히기”보다 훨씬 어렵습니다. 이 논문은 KG를 (head, relation, tail) 트리플의 시퀀스로 선형화해 오토리그레시브로 p(G)를 직접 학습하는 ARK, 그리고 잠재변수 z로 조건부 완성을 지원하는 SAIL을 제안합니다. 높은 semantic validity가 매력적이지만, 사실성·일반화·후처리 기여를 분리해 읽는 시각도 함께 필요합니다.시퀀스로 KG를 만든다는 발상의 장점과 함정이 논문의 핵심 메시지는 사용자가 정리한 대로 “KG 생성은 joint distribution 문제”라는 태도를 끝까지 밀고 간다는 점입니다. 논문은 링크 예측이 트리플을 독립적으로 점수화하기 때문에 타입 일관성, 시간 제약, 관계 패턴 같은 제약을 “그래프 전체 차원에서” 보장하기 .. 2026. 2. 19.
SEMLTL 해부 (라벨, 트루니스, ε) 멀티태스크 RL에서 “LTL 작업 φ를 입력으로 받고, 재학습 없이 즉시 수행하는 universal policy”는 매력적이지만 늘 병목이 있었습니다. 이 논문은 full LTL을 목표로 하면서도, 기존 automaton 기반 방법이 겪는 “전체 LDBA 구성/열거 비용”을 semantic labelling과 on-the-fly 구성으로 정면 돌파합니다.라벨로 바뀐 자동자 상태가 왜 핵심인지이 논문이 새로 한 일의 중심에는 “Universal progress interface(UPI)를 무엇으로 만들 것인가”가 있습니다. 멀티태스크 RL에서 LTL을 다루려면, 정책이 단순히 환경 상태 s만 보는 것이 아니라 “현재 과제 φ의 진행 상황”을 함께 알아야 합니다. 문제는 과제가 매번 바뀌니, 고정된 auto.. 2026. 2. 18.
CodeSSM 해부 (스펙트럼, 타입추론, 커널) 코드 이해 모델을 고를 때 “벤치마크 점수”만 보면 함정이 생깁니다. 이 논문은 CodeSSM이 사전학습에서는 RoCoder보다 코드 구문·의미를 더 잘 잡지만, 타입추론 파인튜닝에서 오히려 일부 관계를 잊는다는 역설을 드러냅니다.스펙트럼 관점에서 본 CodeSSM의 강점이 논문의 가장 설득력 있는 지점은 사용자가 말한 것처럼 “비교 + 진단 + 개선”이 한 흐름으로 닫힌다는 점입니다. 우선 비교 파트에서 저자들은 CodeSSM과 RoCoder를 유사 조건에서 학습한 뒤, DirectProbe로 내부 표현을 진단합니다. 그리고 사전학습 상태(pretrained)에서는 CodeSSM이 AST Distance Prediction, AST Sibling Prediction, DFG Edge Prediction.. 2026. 2. 17.
개념 학습 AI의 확증편향 (정보이득, 긍정검증전략, 제안분포) 인간이 새로운 개념을 학습할 때, 무작위로 정보를 수집하기보다는 전략적으로 질문을 선택합니다. 이러한 능동적 개념 학습(active concept learning)은 불확실성을 줄이기 위한 효율적인 방법이지만, 흥미롭게도 인간은 종종 자신의 가설을 반박하는 증거보다 확인하는 증거를 선호하는 경향을 보입니다. 이를 확증편향(confirmation bias)이라 부르며 오랫동안 인지적 오류로 간주되어 왔습니다. 그러나 최근 대규모 언어모델(LLM)을 활용한 신경기호적 베이지안 학습 시스템 연구는 이러한 확증편향이 오히려 계산적으로 합리적인 전략일 수 있음을 시사합니다. 본 글에서는 기대 정보이득(Expected Information Gain, EIG) 정책과 긍정검증전략(Positive Test Strate.. 2026. 2. 16.

Disclaimer · Privacy Policy · About · Contact

© 2026 테크마스터