MSN 콘텐츠 랭킹 알고리즘 정리

MSN과 MS Start

MSN 콘텐츠 랭킹 알고리즘을 통해 플랫폼들의 알고리즘을 공부합니다. MSN은 이제 MS Start로 리브랜딩했습니다만 사용자들에 알려지지 않아 이 글에서는 MSN으로 부르겠습니다. MS Start는 과거에 MSN이라고 알려진 포털을 리브랜딩한 것으로 2021년 6월 윈도우즈 툴바에 뉴스 위젯 서비스를 시작하며 트래픽이 기하급수적으로 증가했습니다.

MSN 콘텐츠 랭킹 알고리즘은 기준일 뿐이고 100프로 적용되진 않는 것 같습니다. 예를 들어 클릭베이트(낚시성 기사)의 경우 랭킹을 떨어뜨리는 것이라고 표현했지만 AI가 어떻게 클릭베이트와 헤드라인에 후킹을 세게 넣은 기사를 구분할 수 있겠습니까? 결국, 클릭베이트는 이후 독자의 부정적인 반응으로 판단하게 될 것으로 보입니다.

MS Start로 리브랜딩한 MSN 콘텐츠 랭킹 알고리즘
MS Start로 리브랜딩한 MSN 콘텐츠 랭킹 알고리즘

MSN 콘텐츠 랭킹 알고리즘

마이크로소프트는 사용자들에게 최신 개인화된 콘텐츠를 제공하는 Microsoft 시작 피드를 운영하고 있습니다. 이 피드는 알고리즘을 통해 다양한 신호를 기반으로 개인별로 가장 관련성이 높은 스토리를 선택하여 제공하며, 고품질이고 안전한 콘텐츠를 유지하기 위해 주의 깊게 관리됩니다.

사용자의 개인화된 뉴스 피드

마이크로소프트는 모든 소비자에게 개인화된 뉴스 피드를 제공하여 각 사용자의 고유한 관심사와 선호도에 맞는 콘텐츠를 제공합니다. 이를 위해 알고리즘은 사용자의 선호도와 기사 내용을 매칭시키는 방식으로 동작합니다.

명시적 개인화와 암시적 개인화

사용자의 개인화는 명시적인 방식과 암시적인 방식을 통해 이루어집니다. 명시적 개인화는 사용자가 설정을 수동으로 구성하는 작업을 고려합니다. 예를 들어, 특정 주제를 팔로우하거나 특정 콘텐츠를 좋아하거나 싫어하는 작업을 통해 사용자의 기본 설정을 파악합니다. 암시적 개인화는 사용자의 개인 정보 설정과 사용자의 행동 패턴을 분석하여 사용자의 기본 설정을 이해하는 데 활용됩니다.

단락구조의 일반 텍스트

일반 텍스트 문서로 적절한 문장과 단락으로 구분된 형식의 콘텐츠가 잘 노출됩니다. 줄바꿈이 없거나 단락 구분이 안되는 콘텐츠는 노출이 안될 수 있습니다.

원본 기사 링크

원본 기사로 연결하는 링크는 주로 기사 하단에 표시되어야 하며, 텍스트 본문에 원본 링크가 있는 콘텐츠는 노출이 제한될 수 있습니다.

일반 텍스트 URL

콘텐츠에 포함된 링크는 적절한 형식을 갖추어야 합니다. 예를 들어, “https://www.example.com/article”와 같이 올바른 형식의 링크를 사용해야 합니다. 예를 들어 https://www.conotoso.com/r/linden-new-york 같은 형식의 링크는 노출이 안될 수 있습니다

유효한 날짜 형식

콘텐츠의 날짜는 RFC 3339 또는 RFC 822 날짜 형식으로 표시되어야 합니다.

[적절한 날짜 표시 예제]
Wed, 04 Oct 2017 15:00:00 +0200
2017-10-04T08:00:00-05:00

높은 클릭률

일반적으로 CTR(노출 대비 클릭 비율)이 높은 콘텐츠는 보다 높은 순위를 가질 수 있으며, 알고리즘은 각 콘텐츠의 CTR 잠재력을 고려하여 노출 순위를 결정합니다. 낚시성 콘텐츠는 아래 불이익에서 설명합니다

최신성과 적시성

뉴스 피드의 콘텐츠는 최신이고 시의적절해야 합니다. 결과적으로 최신 콘텐츠는 평균적으로 이전 콘텐츠보다 순위가 높습니다. 최신 뉴스, 금융 또는 스포츠 기사는 특히 그렇습니다. 알고리즘은 다른 주제는 더 에버그린한 경향이 있음을 인식하고 이 콘텐츠를 더 오래된 것으로 인식하여 허용합니다. 게시 날짜가 정확하지 않은 콘텐츠는 순위가 낮을 수 있습니다.

트렌드 및 뉴스 가치

일반적으로 현재 유행하는 주제, 뉴스 속보 및 헤드라인 뉴스에 대한 기사가 더 높은 순위를 차지합니다. 피드의 최상위 위치는 종종 뉴스 가치가 있는 오늘의 주요 뉴스를 위해 예약되어 있습니다. 마이크로소프트는 공개 되고 독점적인 여러 외부 데이터 소스를 모니터링하여 트렌드를 관찰합니다. 이 시스템은 Microsoft 캔버스 및 Bing 검색에서 유행하는 것뿐만 아니라 인터넷 전반에서 유행하는 것을 모니터링합니다. 이러한 신호는 결합되고 평균화되어 각 콘텐츠 항목의 추세 가능성을 평가합니다. 잠재력이 더 높은 항목은 피드에서 더 높은 순위에 랭크됩니다.

언론매체의 브랜드 권위

잘 알려진 국내 또는 글로벌 뉴스 게시자의 기사는 소비자와 게시자 모두 더 권위 있고 신뢰할 수 있다고 보기 때문에 더 잘 노출됩니다. 이 점은 구글뉴스의 추천 알고리즘에서 설명한 것처럼 신뢰할 수 있는 언론사를 우대한다는 말입니다. 그러나 현지 브랜드나 잘 알려지지 않은 브랜드의 스토리도 개인화된 피드의 중요한 구성 요소이며 다른 신호로 인해 높은 순위를 차지하는 경우가 많습니다. 마이크로소프트 Start의 알고리즘은 아직 주제별 권위를 분리하지는 않고 있습니다. 예를 들어 일부 언론사는 스포츠 분야에서 더 권위가 있는 반면 다른 게시자는 정치를 전문으로 합니다. 이것은 Microsoft가 향후 순위 업데이트에서 개선할 예정입니다

랭킹에 부정적인 요소들

일부 콘텐츠는 클릭을 유도하지만 사용자의 불만을 야기할 수 있는 잘못된 헤드라인, 과장된 스토리, 낮은 품질의 내용 등을 포함할 수 있습니다. 이러한 부정적인 신호는 알고리즘에 의해 감지되어 순위가 낮아질 수 있습니다. 클릭 베이트의 특정 패턴은 다음과 같습니다.

  • 특히 “this”라는 부사를 과도하게 사용하는 헤드라인 (예: Never Drink This on a Plane)
  • 헤드라인과 실제 기사 내용이 달라 독자의 만족스럽게 하지 못하는 기사. 이런 유형은 헤드라인에 언급된 영상을 생략하거나 핵심 키워드를 전혀 다루지 않는 것까지 다양할 수 있습니
  • 제목, 본문 또는 이미지가 혐오스럽거나 자극적인 경우 콘텐츠가 영향을 받을 수 있습니다. 여기에는 다음과 같은 주제가 포함됩니다.( (예: 방귀, 배설물, 배뇨, 여드름 터짐, 성병, 정치 스캔들과 같이 더 넓은 사회적 연관성이 없는 음란한 만남, 구체적인 성행위 또는 끔찍한 살인 묘사, 모든 시청자에게 제공하기에 부적절할 수 있는 성적 행동, 성인의 성적 조언 등)
  • 유명인 가십: 우리는 이제 유명인 싸움, 유명인이 입고 있는 것을 성적으로 표현하는 것, 의상 오작동, 일상적인 유명인 활동, 관계 문제 등에 초점을 맞춘(이에 국한되지 않음) 유명인 콘텐츠의 노출을 제한하고 있습니다. 이 콘텐츠는 Microsoft Start에 계속 나타납니다. 그러나 페이지는 이러한 유형의 콘텐츠를 찾는 사용자에게만 노출됩니다.

[참고] MS Start[舊MSN] 현황

MS Start 서비스 변화 추이

  • 2020년 7월 : 뉴스 수동 편집을 중단하고 뉴스편집 전면 자동 알고리즘 반영
  • 2020년 9월 자동 배열 알고리즘에 개인화기반 규칙 반영
  • 2021년 6월 : 윈도우 툴바에 뉴스 위젯 서비스 시작
  • 2021년 9월 : 에지(Edge) 브라우저 시작화면에 뉴스 배치, 마이크로소프트 Start 브랜드 론칭

2022년 MS Start 사용자 현황

  • 일평균 8천600만 사용자
  • 월평균 5억1,900만 사용자
  • 매월 57억개의 기사(stories)가 업데이트

2023년 MS가 이용자 만족을 위해 추진 중인 것들

  • 지역 및 하이퍼로컬 콘텐츠, 틈새(niche) 콘텐츠
  • 버티컬 컨텐츠(날씨, e스포츠, 경제, 스포츠, 쇼핑)
  • 현재 미국과 독일에서 오픈 플랫폼 형태로 CP(Contents Provider)를 베타 형태로 모집중.
  • 오픈 플랫폼을 위해 워드프레스에서도 MS뉴스를 발행할 수 있도록 할 예정임
  • ChatGPT를 기반으로 한 뉴빙 검색 (끝)

Leave a Comment