Home > AccessLogParsePractice

AccessLogParsePractice

AccessLogParsePractice is a project mainly written in Java, it's free.

Parse URL and CV


Hadoop Access Log Parse Practice

by Hideya Kato

擬似アクセスログのパースを行うMapReducePractice

■goal ・入力データとして [日時] [ユーザID] [URLID] [CVID] 18:00 user1 1 0 18:02 user2 1 0 18:03 user1 2 0 18:05 user2 0 2 18:07 user1 0 1 18:08 user1 0 2

・結果として [URL日時] [CV日時] [ユーザID] [URLID] [CVID] 18:03 18:07 user1 2 1 18:02 18:05 user2 2 2

ユーザー単位で最後にアクセスがあったURLIDに対し、 CVIDを紐付ける。

-- Hideya Kato 2011

Previous:Wavulum