【发布时间】:2015-07-02 16:50:48
【问题描述】:
我想使用 HBase 创建一个点击流应用程序,在 sql 中这将是一项非常简单的任务,但在 Hbase 中我没有第一个线索。有人可以建议我在 HBase 中使用的架构设计和键。
我提供了一个粗略的数据模型和几个我想询问数据的问题。
关于访问数据我想问的问题
哪些事件导致了转化? 最后一页是什么/浏览了多少页? 客户放弃了哪些页面? 20-30岁的男性顾客喜欢买什么产品? 客户购买了产品 x 也可能购买产品 y? 第一页的转化量?
{
PageViews: [
{
date: "19700101 00:00",
domain: "http://foobar.com",
path: "pageOne.html",
timeOnPage: "10",
pageViewNumber: 1,
events: [
{ name: "slideClicked", value: 0, time: "00:00"},
{ name: "conversion", value: 100, time: "00:05"}
],
pageData: {
category: "home",
pageTitle: "Home Page"
}
},
{
date: "19700101 00:01",
domain: "http://foobar.com",
path: "pageTwo.html",
timeOnPage: "20",
pageViewNumber: 2,
events: [
{ name: "addToCart", value: 50.00, time: "00:02"}
],
pageData: {
category: "product",
pageTitle: "Mans Shirt",
itemValue: 50.00
}
},
{
date: "19700101 00:03",
domain: "http://foobar.com",
path: "pageThree.html",
timeOnPage: "30",
pageViewNumber: 3,
events: [],
pageData: {
category: "basket",
pageTitle: "Checkout"
}
}
],
Customer: {
IPAddress: 127.0.0.1,
Browser: "Chrome",
FirstName: "John",
LastName: "Doe",
Email: "john.doe@email.com",
isMobile: 1,
returning: 1,
age: 25,
sex: "Male"
}
}
【问题讨论】:
标签: hadoop schema hbase bigdata