스팀잇 이상탐지 보고서(v2.0)-오전(UTC) (2018-01-26 ~ 2018-01-26 12:00:00)

in kr •  7 years ago 

본 보고서는 공개되어있는 데이터를 활용하여 스팀잇내에서 의심되는 행동(Suspicious Behaviour)을 하는 유저들을 잡아냅니다. 스팀잇 구조상 글 작성자와 구독자는 보팅을 통해 보상을 받게 됩니다. 글 작성자에게는 글 작성에 대한 노력에 대한 보상으로 author rewards를 그리고 보팅을 한 유저에게는 curation rewards을 받게 되는데요, 현제 스팀잇은 글(article)이나 댓글(comment)를에 대해 보팅을 할 수 있게 되어있습니다. 여기서 자신이 작성한 글/댓글에 보팅을 통한 보상도 가능 한데요. 물론 이것이 나쁘다는건 아닙니다. 최소한 자신이 공들여 작성한 글에 최소한에 보상을 받을 수 있으니까요. 하지만 이 시스템을 악용하는 사례들도 있습니다.

저는 Block-Chain 기술의 가장 큰 장점이 모든 거래정보를 공개하는 것에 있다고 보는데요. Black-chain 기술 기반으로 만들어진 스팀잇내에서는 유저의 모든행동, 글/댓글 작성 및 보팅 내역 포함이 모두 공개 되어 있습니다. 하지만 모든 사람이 스팀잇이 제공하는 정보를 쉽게 접근 할 수는 없는데요. 이 보고서의 취지는 스팀잇에서 공개하는 데이터를 될 수 있으면 모든사람들이 쉽게 받아들일 수 있는 형태로 가공/전달 하는데에 있습니다.

현재로선 유저의 실제 아이디명은 공개 하지 않겠습니다. 다만 Block-chain 기술은 당신의 모든 행동을 정보화 하면 공개되어있다는 사실을 아셨으면 합니다.

데이터 기간 (2018-01-26 ~ 2018-01-26 12:00:00)

-총 데이터 수: 62801

-기간내의 총 스팀잇 유저수: 17732

Self-Voting (SV)


상단에 위치한 그래프는 2018-01-26 ~ 2018-01-26 12:00:00 동안 자신의 글/댓글에 보팅을(=SV)하신 SV수-유저수를 보여줍니다.

총 17732 SV 유저 분석결과 평균 SV수는 3.54 ,최대 SV수는 646 그리고 분포는 8.62 로 나타났습니다 (상단 그래프).

2018-01-26 ~ 2018-01-26 12:00:00 동안 자신의 글/댓글에 보팅을 한 Top 10:


Self-Voting 탑 10 유저의 7일 동안의 보팅 패턴


위 네트워크는 (2018-01-23 ~ 2018-01-26 12:00:00)기간 동안 SV유저(빨강색)들의 보팅 패턴을 통한 다른 유저들과의 관계를 보여줍니다.


Self-Voting 1위~5위


Self-Voting 6위~10위


상단에 위치한 그래프는 SV 기준 상위 10명에 대한 날짜별 (2018-01-23 ~ 2018-01-26 12:00:00) 동안 총 보팅수(회색), SV수(빨강) 그리고 다른유저에 대한 보팅수(파란색)를 보여줍니다.

High-Self-Voter(H-SV) 스팀잇 유저들의 Suspicious 스코어

H-SV 스팀잇 유저들의 Suspicious 스코어는 다음 특징들을 가지고 추출합니다:

-보팅파워(VP) -- 유저의 보팅별 보팅파워

-보팅수(voting_cnt) -- 기간동안 유저의 총 보팅수

-셀프 보팅수(sv_voting_cnt) -- 기간동안 유저가 자신의 글/댓글의 보팅수

-타유저 보팅수(nsv_voting_cnt) -- 기간동안 유저가 다른 타유저에게 한 보팅수

-타유저수(author) -- 기간동안 유저가 보팅한 타유저수

위 특징들에서 추출된 지표들은 다음과 같습니다:

-평균 셀프 보팅 파워(sv_avg_vp) -- 유저가 자신에게준 평균 보팅파워 (=SV 총 VP합/sv_voting_cnt)

-평균 타유저 보팅 파워(nsv_avg_vp) -- 유저가 타유저가준 평균 보팅파워 (=NSV 총 VP합/nsv_voting_cnt)

-셀프 보팅비율(sv_ratio) -- 유저의 셀프보팅 비율 (=sv_voting_cnt/voting_cnt * 100)

-평균 타유저 보팅수(VPA) -- 타유저가 밭은 평균 보팅수 (=nsv_voting_cnt/author)

보상측정을 위한 가상지표들은 다음과 같습니다 (USD):

-가상 총 자기자신 보상금액(SR - Self Rewards) -- 유저의 보팅보상을 $1로 봤을때의 자신의 총 보상액 (=(1 * sv_avg_vp) * sv_voting_cnt)

-가상 총 타유저 보상금액(NSR - Not Self Rewards) -- 유저의 보팅보상을 $1로 봤을때의 타유저의 총 보상액 (=(1 * nsv_avg_vp) * nsv_voting_cnt)

-평균 타유저 보상금액(RPU) -- 유저의 보팅보상을 $1로 봤을때의 타유저의 평균 보상액 (=NSR/author)


(2018-01-26 ~ 2018-01-26 12:00:00)기간 동안 H-SV 스팀잇 유저들의 보팅 패턴(보팅수(voting_cnt), 셀프 보팅수(sv_voting_cnt), 타유저 보팅수(nsv_voting_cnt), 타유저수(author), 셀프 보팅비율(sv_ratio), 평균 타유저 보팅수(VPA))분포을 보여줍니다.


H-SV 스팀잇 유저중에서 상대적으로 보팅비율(SV_Ratio)이 높은 유저(9~10)들의 보팅 패턴 - 빨강색


H-SV 스팀잇 유저의 보팅 보상을 $1로 계산했을때 자신(빨강색)과 타유저(파랑색) 보상 분포입니다.

Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!
Sort Order:  

저.. 죄송한데, 그래서 결론이 뭔가요?ㅠㅠㅠ