분석 자료라 내용이 다소 깁니다. 천천히 읽어보시면 좋을 것 같습니다. 바쁘시면 대강 그래프만 보고 제일 마지막 부분의 결론만 보셔도 무방합니다. 참고로 저는 트위터와 소셜네트워크를 분석하는 ‘트윗믹스‘를 만들었고 운영하고 있는 유저스토리랩을 공동창업했으며 현재는 기획팀장을 맡고 있습니다.
10.26 재보선이 마무리됐습니다. 선거기간 동안 고생했던 후보와 선거 운동에 직접적이든 간접적이든 참여하신 분들 모두 수고하셨습니다. 가장 치열한 곳에서 승리한 박원순 서울시장께 우선 축하를 드립니다. 대한민국은 길지 않은 시간 동안 무상급식 주민투표 무산, 오세훈 전 서울시장의 사퇴, 이후 안철수 바람과 야권단일후보의 선출, 나경원 후보와 박원순 후보 사이의 치열한 경쟁, 오늘 박원순 후보의 당선까지, 바쁘게 달려왔습니다. 물론 거기에는 나는꼼수다 열풍과 SNS 선거 열풍까지 빼놓을 수 없을텐데요.
선거에 대해서는 다양한 분석 결과가 나오겠습니다만, 트위터를 중심으로 한 SNS 선거운동 그리고 열풍에 대해서 정리해볼까 합니다. 트윗믹스는 선거 열기가 절정에 오를 즈음 서울시장의 두 주요후보에 대한 선거 페이지를 만들었고, 많은 분들의 관심속에서 운영해왔습니다. 2011년 10월 11일부터 선거운동이 마무리됐던 25일까지 보름동안 나경원 후보에 관한 트윗은 53만건, 박원순 후보에 관한 트윗은 45만건이 작성된 것을 확인했습니다.
정리를 하다보니 이 숫자부터 흥미롭습니다. 언급횟수를 비율로 따져보면 ‘나경원 vs 박원순’이 ‘54% vs 46%’로 나타났습니다. 더 정확히는 나경원 후보 관련 트윗이 53.98%였고, 박원순 후보를 언급한 트윗이 46.02%였는데요. 실제 투표 결과에서는 이 숫자가 단순히 반대로 됐습니다. 최종 투표율은 ‘46.21% vs 53.40%’ 정반대의 결과이긴 했지만 1% 미만까지 일치한 우연이 놀랍기만 합니다. 그럼 본격적으로 각 부분에 대해서 정리해보겠습니다.
1. 선거 기간 트윗 메시지의 폭발적인 증가!
아래 그래프는 8월 25일부터 10월 25일까지 약 2달 동안의 트윗믹스 데이터 수집결과입니다. 트윗믹스는 링크 정보를 중심으로 정보를 수집/분석하는 서비스를 제공하고 있습니다. 우선 두 달동안 트윗의 양은 꾸준히 증가해왔음을 알 수 있습니다.
실제 데이터를 살펴보면 8월 25일에 비해서 10월 25일에는 1.5배나 많은 트윗이 생산되었습니다. 선거가 치열해질수록 트위터도 더 뜨겁게 달궈졌다는 의미입니다. 선거를 계기로 뜨겁게 달궈진 트위터가 이후에도 계속 증가세를 이어갈지, 아니면 선거라는 이벤트를 맞이한 반짝 효과일지는 계속 지켜봐야 할 것 같습니다(트윗믹스에서는 정기적인 분석 보고를 통해서 향후 흐름에 대해서도 공유하겠습니다).
이전에도 한국 트위터 사용자와 이 사용자들이 생산하는 트윗양은 계속 꾸준히 증가하고 있었습니다만, 그럼에도 불구하고 최근에는 다른 SNS 서비스 사이의 경쟁에서 페이스북 성장이 조금 더 높은 것으로 알려져왔습니다. 선거라는 특성은 컨텐츠와 이슈가 더 빨리 전파되는 것을 요구했고, 이에 따라 훨씬 미디어지향적이며, 메시지 유통이 쉬운 트위터가 페이스북보다는 선거에서 더 중요 변수로 자리잡았다고 생각됩니다. 지난 선거와 트위터 변화량을 비교해보면 4.27 재보선에서 주요 후보 관련 트윗은 95,792개(중복 포함)였고, 이번 10.26 재보선에서는 서울시장의 두 후보 관련 트윗만 985,158개(중복포함)였습니다. 무려 10배 가까이 메시지가 증가한 것이죠.
이런 폭발적인 트윗 증가의 중심에는 나경원, 박원순 후보가 있었습니다. 두 후보만 놓고 볼 때 최종적으로는 나경원 후보에 관한 트윗이 박원순 후보에 관한 트윗보다 많았습니다. 이런 현상에 대해서는 이미 다른 보도를 통해서 접하셨을 수도 있을텐데요. 지난 보름간의 “나경원” “박원순”이라는 키워드로 얼마나 많은 메시지들이 작성됐는지 그래프(아래)를 살펴보죠. 트윗수는 경쟁이 치열해질수록 더 많은 늘어나고, 특히 선거를 바로 코앞에 두고는 나경원이라는 키워드의 엄청나게 많이 작성된 것을 알 수 있습니다.
트윗 자체 뿐 아니라, 언급한 사용자(한 사용자가 여러번 트윗을 하였더라도 한 번으로만 계산하는 방식)에서도 유사한 결과(아래 그래프)를 보여줬습니다. 보름동안 나경원 후보를 언급한 사용자의 숫자는 63,375명(중복 제외)였고 계정 1인당 평균 8.39개의 트윗을 남겼습니다. 박원순 후보를 언급한 사용자는 54,261명(중복 제외)였으며 계정 1인당 평균 8.36개의 트윗을 남겼습니다.
2. 트윗 내용은 박원순 후보에게 긍정, 나경원 후보에게 부정적
트윗의 숫자가 아니라 내용을 살펴보겠습니다. 열기가 가장 뜨거웠던 선거 전 일주일 동안 가장 많이 리트윗(RT)된 트윗의 내용을 분석해보면 트위터의 여론을 분명하게 알 수 있습니다. 나경원 후보와 관련되어 가장 많이 리트윗된 트윗 상위 10개는 모두 나경원 후보에게 부정적인 내용이였지만, 박원순 후보와 관련되어 가장 많이 리트윗된 트윗 상위 10개는 반대로 박원순 후보에게 긍정적인 내용이였습니다. (아래는 캡쳐이미지이며 실제 내용은 여기에서 확인할 수 있습니다)
내용을 살펴보면 나경원 후보가 언급된 트윗 중에서 가장 많이 RT된 트윗은 ‘나경원 네거티브 실체 분석‘라는 제목의 유튜브 영상입니다. 대학생이 만든 이 영상은 3천번 이상 리트윗되고 유튜브에서 27만 6천건이 넘는 조회수를 기록했습니다. 이후에도 나경원 후보의 전 보좌관이 쓴 나경원 후보에 대한 반대 게시물과 억대 피부클리닉 논란 등이 트위터에서 많이 리트윗되고 유통되었습니다.
박원순 후보의 경우는 안철수 원장이 박원순 후보에게 보낸 편지, 선관위의 박원순 후보 이력 정정 공문과 관련된 내용 등이 일주일 기준으로 가장 많이 리트윗 된 것으로 나타났습니다. 모두 후보에게 도움이 되는 트윗이였습니다. 이는 선거 직전 발생한 이슈를 짧은 시간동안 더 많이 알려서 박원순 후보를 돕고자했던 트위터 사용자들의 영향으로 보입니다. 박원순 후보 관련 주요 이슈 중에는 말씀드린 것처럼 대부분 긍정적이였는데, 단순히 숫자만 놓고보면 나경원 후보가 언급된 리트윗 횟수보다는 1/3수준으로 작았습니다. 아니라고 말하고 싶지만, 역시 부정적인 메시지가 훨씬 감성을 자극하고, 그래서 더 잘(많이) 유통됩니다.
3. 정책과 공약을 담고 있는 공식 홈페이지는 트위터에서 많이 유통되지 않았다
각 후보가 내세우는 정책과 공약에 대해서 일반 대중이 가장 잘 알 수 있는 곳은 공식홈페이지입니다. 나경원 후보와 박원순 후보는 선거 기간 동안 정책과 공약을 잘 정리해서 홈페이지에 담았습니다. 그밖에도 주요 이슈가 생길 때마다 홈페이지를 통해서 해명 혹은 논평을 공개했습니다.
트위터는 겨우 140자의 메시지만 남길 수 있습니다. 감성적인 메시지나 행동을 요구하는 메시지는 트위터로 작성되고 트위터를 통해서 빠르게 많은 사람들에게 유통될 수 있겠지만, 보다 많은 정보를 전달하기 위해서는 홈페이지 혹은 블로그와 연계하는 것이 필요합니다. 트위터가 유통수단이라면, 컨텐츠 자체는 홈페이지에 있게 되죠.
선거 기간 트위터 열기에 비해서, 공식홈페이지에 게시된 내용이 트위터를 통해서 알려지는 횟수는 상대적으로 적은 편이였습니다. 각 후보의 캠프에서는 공식 트위터 계정을 통해서도 홈페이지에 있는 정책과 논평, 후보와 관련된 글을 많은 공유했지만 확산은 다른 기사 혹은 게시물에 비해서 그리 성공적이지 못했던 것 같습니다. 박원순 후보의 홈페이지는 트위터를 통해서 전체 12,046번(전체기간 누적) 리트윗 되었으며 나경원 후보의 홈페이지는 4,724번(전체기간 누적) 리트윗 되었습니다. 다만 이 숫자는 선거 이전에 공유된 수치도 반영된 것입니다.
선거 기간 동안 가장 많이 리트윗 된 홈페이지의 내용을 정리하면 아래와 같습니다(클릭시 확대됨). 박원순 후보 홈페이지에서는 메인페이지가 395번 RT되어 가장 많이 RT된 페이지로 나타났습니다. 뒤를 이어 박원순 후보의 방송 광고를 실은 페이지가 189번 RT됐습니다. 이후 논평과 캠페인, 안철수 원장의 응원편지 순입니다. 나경원 후보는 선거 직전 안철수 교수가 박원순 후보를 지지하는 방법을 찾고 있다는 기사가 나온 뒤에 나온 후보측의 논평이 229번으로 가장 많이 RT됐습니다. 하지만 해당 논평에 대한 트위터 사용자의 반응은 우호적이지 않았습니다. 특히 스티브 잡스 사망 후 ‘iSad’라는 사진 해프닝과 연계되어 구설수에 올랐는데, 다시 스티브 잡스를 언급해서 반발을 가져온 측면도 있습니다. 하지만 대부분 공식 홈페이지를 후보에게 반대의사를 표명하기 위해 RT하는 경우는 많지 않아서 나경원 후보 홈페이지도 두번째부터는 나경원 후보에게 힘을 내라는 메시지, 나경원 후보의 메시지, 후보의 정책을 공유한 트윗과 같이 우호적인 메시지들이 차지했습니다.
4. 공식트위터 계정 운영은 박원순 후보 캠프가 더 활발했다
각 캠프의 공식 트위터를 운영하는 부분에서는 박원순 캠프가 나경원 캠프를 압도했습니다. 선거가 시작되기 전부터 박원순 후보의 공식 트위터는 나경원 후보의 트위터에 비해서 약 2배 정도의 Followers 숫자를 가지고 있었습니다. 실제 선거가 치열해질수록 박원순 후보의 Followers 숫자가 더 빠르게 증가해서 점점 격차를 벌렸습니다. (참고로 아래 두 그래프는 TWITTER COUNTER의 그래프이며, 그 외 모든 자료는 트윗믹스 분석을 통해서 자체적으로 만든 자료입니다)
봉간님이 새로운 이정표를 만든 것 같습니다. 선거와 SNS의 상관관계에 대한 훌륭한 분석 자료 입니다.
안녕하세요! 감사합니다. 사실 저야 데이터 정리한 것 뿐인데… 아무튼 앞으로도 유심히 지켜볼만한 이슈 같습니다.
안녕하세요.BKlove 선생님
제 이름은 박진영이라고 합니다. 현재는 소속이 없어서 소속을 밝힐 곳이 없습니다. ㅠㅜ
저는 소셜미디어에 관심이 많고 이런 기획과 분석쪽으로 일을 하고 싶어 하는 사람입니다.
선생님께서 이번에 분석하신 글을 보고 궁금한 점이 있어서 글을 남깁니다.
궁금한 부분은 두번째 영역
2. 트윗 내용은 박원순 후보에게 긍정, 나경원 후보에게 부정적
말씀하신 것 처럼 상위10개를 기준으로 전반적으로 긍정적인 내용이 많이 분포 되었다 라고 나누신건지 아니면 따로 기준을 잡고 프로그램을 통해서 나누신건지 궁금합니다.
전에 제가 컨퍼런스등을 통해 데이터마이닝 기술을 통해 분석하고 긍정,부정,중립 등으로 나누어서
정보의 가치를 나눈다고 들었습니다.
그런데 다들 하나같이 이 데이터마이닝에서 긍정과 부정을 나누는 기준을 말씀을 안해주셨습니다.
물론 기업 비밀 이실 수도 있지만, 사용자로서는 이러한 데이터마이닝을 신뢰하기 위해서는
어떤 기준으로 정보가 나누어지는지 알고 싶지않으까 하는 생각을 합니다.
실제로 그분들은 어떤지 모르겠지만… 저는 항상 궁금했습니다.
제가 이런 소셜미디어 기획이나 분석쪽으로 지식이 너무 없어서 궁금했던 차에 선생님께서 이런 좋은 내용을 올려 주시길래 혹시 조금 배울 수 있지 않을까해서 질문을 드립니다.
혹시 조금이라도 알려 주실 수 있으시다면 알려 주시면 감사하겠습니다.
정말 방대한 자료를 이렇게 잘 분석하여 보기 좋게 공유해 주셔서 너무 감사드립니다.
질문 내용도 길고, 조금 부끄러워서 선생님만 보실 수 있게 비공개 글로 올려 둡니다.
양해해주시면 감사겠습니다.
안녕하세요. 일단 저는 애초에 수십만건에 해당하는 후보 관련 트윗에 대해 긍정과 부정으로 판단하고자 했던게 아니라 / RT 횟수로 분류해서 상위에있는(그러니까 많이 RT된) 20건의 트윗과 링크 내용을 대상으로 긍정+부정을 판단한 것이므로 별로 어려움 없이 비교적 짧은 시간에 링크 하나하나 클릭해서 판단했습니다. 하하하. 생각보다는 싱겁죠?
만약 데이터가 충분히 많아서 컨텐츠를 하나씩 볼 수 없는 상황이라면. 어쨌든 데이터에 포함된 내용의 분석을 자동화해서 의미를 파악해야겠죠. 크게는 긍정, 중립, 부정으로 나누겠지만. 아예 긍/부정을 나눌 수 없는 것들도 있을거구요. 컴퓨터야 문장 자체의 의미를 파악할 수 없을거니까 단어의 의미를 분석하게 되겠죠. 긍정적인 단어, 부정적인 단어. 물론 아래 링크에서도 언급되지만 단순히 단어 하나가 아니라, 특정한 키워드 관련 단어를 통해서 분석해야하니 실제는 그보다 더 어려울 것 같습니다. (드디어 보상받았습니다라는 문장이 있다고 할 때 “보상”이라는 단어는 어떤 의미에서 긍정적이지만, 어떤 회사와 관련되어 “보상”이라는 단어가 등장했을 때 전혀 다른 의미로 사용될 수 있으니까요. 학력 논란이라는 말에서도 논란 자체는 부정적이지만, 선거이고 논란이 상대방 후보에게서 일어났다면 이건 다른 쪽 후부에게는 긍정적인 이슈라고 봐도 될테니까요.)
결국 조금 생각해봐도 한국어로 만들어진 문장은 단순히 단어와 단어의 연관관계를 통해서 어떤 의미를 가지는지 파악하기가 쉽지 않아 보입니다(물론 다른 나라 언어도 쉽지만은 않게지만 한국어는 어휘활용이 정말 다양해서). 저도 이쪽 전문가는 아니라. 조금 더 살펴보시려면 http://blog.scotoss.com/100 를 참고해보시는게 좋겠네요 :)
저희가 생각하는 부분은 조금 다른 곳에 있습니다. 만약 사용자(분석자)의 니즈가 ‘많은 데이터가 좋은 내용인지, 안좋은 내용인지 자동화해서 나누고 싶어’라면 어떻게해서든 자동화 긍/부정 분석을 해야겠지만. 만약 저희가 했던 방식대로 애초에 정보를 특정한 기준(저희는 링크와 RT)으로 나누고, 그중에 제일 많이 관심을 받은 정보의 의미를 분석한다면. 그러니까 사람이 확인할 수 있는 수준으로 데이터를 묶고 그것만 분석을 시도하는거죠. 아무리 잘 만들어도 어차피 컴퓨터가 할 수 있는 영역은 한계가 있으니까요. 다만, 데이터가 아주 많은 상황에서 어쩔 수 없이 한다면, 충분히 잘만들어진 분석기라면 일정 정도는 잘못 분류되더라도 전체적으로 분류가 가능할 것도 같습니다.
안녕하세요. 김봉간 이사님
자세한 설명 정말 감사드립니다.
상위의 내용을 분석하신 것이라 해도 그것이 간단한 분석은 아니였을거라고 봅니다.
일일이 내용을 확인하시고 이를 판단하고, 자료를 정리해 공유하는 것 자체가 멋진 노력이라고 생각합니다.
이사님 말씀을 듣고나니 어떤 목적이냐에 따라서 그에 맞는 방법을 찾아서 사용하는게 맞는거 같습니다.
더불어 이 데이터를 분석하는 사람의 역량에 따라 그 결과 와 활용이 큰 차이가 나타날거 같습니다.
이러한 결과들을 활용 할때도 이러한 점들을 많이 고려하겠습니다.
이사님 덕분에 좀 더 많은 내용을 알 수 있게 되어 너무 기쁩니다.
바쁘신데도 자세한 설명을 해주셔서 너무 감사드립니다.
알려주신 곳을 통해 저는 좀 더 많이 공부하도록 노력하겠습니다.
다시 한번 감사드립니다.
네. 사실 쉽지 않은 문제이고, 답을 가진 곳도 없지 않을까란 생각이 듭니다.
일단 어쨌든 저는 사람에게 더 믿음이가요. ㅋㅋ
앞으로 좋은 결과, 방법을 만들게 되시면 공유해주세요. 저희도 다양한 실험을 해보고 싶은데. 사실 마음처럼 잘되진 않지만. 서로 발전하면서 이슈가 공유되면 좋을 것 같네요.
덧. 여담인데. 질문이 하나 있습니다. 사실 회사를 창업하면서. 아직 어린 나이라(지금은 어리지도 않지만 ㅠㅠ) 이사라는 칭호 자체가 사실 별게 아닌데 전 어색하더라구요. 사실 팀장도 어색하지만. 뭐라도 호칭을 두고자 그나마 쓰는데. 어떻게 이사라고 부르시게 됐는지 궁금해서요. 글에서도 일부러 팀장이라고 한건데 ㅋㅋ
흥미롭게 잘 보았어요. 갖고 있는 노하우를 활용해 적절한 타이밍에 의미있는 분석과 설명으로 정보를 공유한다는 건 너무나 멋진 일이네요. BKLove님과 유저스토리랩의 앞으로가 더 기대됩니다^^
하하하 감사합니다. 열심히 잘해야 할텐데요. 응원에 기를 받아~ 조금 더 열심히~ 사실 열심히보다는 조금 더 많은 여유를 가져야 더 잘될거 같긴.
10월 26일… 역사에 남을 서울시장 재보선선거가 박원순 서울시장의 당선으로 끝났다. 그리고 역시나 예상대로, 트위터에서의 여론과 선거를 독려하는 활동이 실제 선거 결과에 어떻게 영향을 주었는지에 대한 기사들이 속속 나오고 있다. 그런데 피상적인 이야기에 그치거나 너무 단편적인 이야기만 하는 것 같아서 좀 심도있게 정리해 보고자 한다. 참고로 나는 현재 하는 일들과는 약간 거리가 있지만, 현업에 있을 때 게임이라는 가상 공간에서 사람들의 행동 패..
안녕하세요, 민주언론시민연합입니다.
이렇게 연락드린 건 다름이 아니라,
SNS의 영향력에 대해 객관적 지표를 가지고 분석한 글을 찾던 중 선생님의 글을 보게 되었습니다.
저희 민주언론시민연합 계간지 <시민과언론>에 SNS 분석 기관을 글을 싣고자 하는데,
선생님의 트위터에 대한 분석이 정리가 잘 되어 있어서 기고가능하신지 여쭤보려고 연락드렸습니다.
저는 민주언론시민연합 활동가 윤지선입니다
02-392-0181/ ccdm1984@hanmail.net
괜찮으시면 자세한 내용을 정리해서 이메일로 보내드리려고 합니다. 연락기다리겠습니다^^
안녕하세요? 이 포스트를 제 논문에서 이용하고자 하는 한 대학의 학부생입니다.
정확히는 네거티브 전략과 이에 대한 해명이 지지율에 미치는 영향에 대해 연구하고 있는데요
여기서 10.26 재보궐 선거에 특히 무게를 두는 까닭으로 SNS의 두드러진 활약을 들고 있거든요
마땅히 자료가 없던 차에 트윗, 리트윗 수 등이 정확히 분석되어 있어서 참조하고 싶습니다.
출처는 당연히 표기할 것이고, 여기 글에 펌 거부 등을 안하셨지만… 혹시 몰라서 이렇게 허락을 구합니다.
네. 편하게 인용/전제로 사용하셔도 됩니다. 그럼.
안녕하세요, 저는 선거캠페인과 sns활용에 대한 논문을 쓰고자하는 한 학부생입니다. 다름이 아니라 선생님의 포스팅이 10.26 재보궐선거를 명확히 분석하고있어서 이를 활용하고싶습니다. 물론 출처는 확실히 밝힐 생각입니다. 그런데 이미지가 깨진 것으로 나오는데 혹시 한 번 확인해주실 수 있을까해서 댓글 남깁니다.