AccessLogParsePractice is a project mainly written in Java, it's free.
Parse URL and CV
by Hideya Kato
擬似アクセスログのパースを行うMapReducePractice
■goal ・入力データとして [日時] [ユーザID] [URLID] [CVID] 18:00 user1 1 0 18:02 user2 1 0 18:03 user1 2 0 18:05 user2 0 2 18:07 user1 0 1 18:08 user1 0 2
・結果として [URL日時] [CV日時] [ユーザID] [URLID] [CVID] 18:03 18:07 user1 2 1 18:02 18:05 user2 2 2
ユーザー単位で最後にアクセスがあったURLIDに対し、 CVIDを紐付ける。
-- Hideya Kato 2011