-
数据挖掘中的模式发现(八)轨迹模式挖掘、空间模式挖掘
所属栏目:[大数据] 日期:2020-12-25 热度:118
副标题#e# 这是模式挖掘、数据挖掘的一部分应用。 空间模式挖掘(Mining Spatiotemporal Patterns) 两个空间实体之间存在若干拓扑关系,这些关系基于两个实体的位置: 分离 相交 包含 如图所示地表示位置信息,可以提取类似下面的规则: is_a(x,large_town)?[详细]
-
企业BI系统应用的切入点及五大策略
所属栏目:[大数据] 日期:2020-12-25 热度:80
从技术的角度来看,BI的技术正在走向成熟,处于一个发展的阶段,但它促使了BI的应用在成本方面开始逐步的降低,越来越多的企业在BI应用方面取得了成功。从实施的角度来出发,实施商业智能系统是一项复杂的系统工程,整个项目涉及企业管理,运作管理,信息[详细]
-
挖掘隐式启动Activity可能存在的坑
所属栏目:[大数据] 日期:2020-12-25 热度:85
今日科技快讯 很早之前,谷歌母公司Alphabet的董事长施密特就曾经表示,在中国市场,谷歌需要寻找到一个商业伙伴来开展自身的一些业务。而近日有消息传出,谷歌和网易正在进行合作磋商,很可能是成立合资公司,在国内推出针对中国市场的Google Play应用商[详细]
-
蓝桥杯-区间k大数查询
所属栏目:[大数据] 日期:2020-12-25 热度:165
从题目上看,用int类型数据就够了,没必要考虑long这些~~ 在题目中,直接用了Collection工具类中的sort方法,是从小到大排序,据了解,Java自带的排序算法应该是优化过的快速排序,算法可靠。 package 区间k大数查询;import java.util.ArrayList;import ja[详细]
-
数据挖掘中的模式发现(五)挖掘多样频繁模式
所属栏目:[大数据] 日期:2020-12-25 热度:97
副标题#e# 挖掘多层次的关联规则(Mining Multi-Level Associations) 定义 项经常形成层次。 如图所示 那么我们可以根据项的细化分类得到更多有趣的模式,发现更多细节的特性。 Level-reduced min-support 使用的是Level-reduced min-support方法来设置最低[详细]
-
关于评论话题挖掘的研究及其实现代码(一)LDA
所属栏目:[大数据] 日期:2020-12-25 热度:197
引言 在 2016年中,我们参加了一个由厦门信研院举办的大数据比赛。当时,我们拿到的题目为影迷关注点分析。数据是来自于微博与豆瓣的影迷评论数据,其数据量达600多万条评论数据,分别对应于2000多部不同的电影。我们的想法是将影迷关注点分析尽量往评论话[详细]
-
内衣大数据分析:透过女生内衣的需求变化,看年轻人的情趣生活
所属栏目:[大数据] 日期:2020-12-25 热度:193
报道大数据企业:大数据产品、大数据方案、 ? 大数据人物 分享大数据干货:大数据书籍、大数据报告、 大数据视频 本文系大数据人精选自网络。 欢迎更多优质原创文章投稿给大数据人:admin@bigdata.ren 小编微信:data985 End. 版权声明:由“大数据人”推[详细]
-
[bigdata-041] python3+re 正则表达式 手机号微信号qq号
所属栏目:[大数据] 日期:2020-12-25 热度:58
import reREGEX_PHONE = re.compile(r'1d{10}',re.IGNORECASE)REGEX_QQ = re.compile(r'[1-9]d{4,10}',re.IGNORECASE)REGEX_WX1 = re.compile(u'微信[w,-]{1,20}'.encode('utf8'),re.IGNORECASE)#正则手机号码def get_all_phone_num(s1): global REGEX_[详细]
-
数据挖掘:手把手教你做文本挖掘
所属栏目:[大数据] 日期:2020-12-25 热度:72
副标题#e# 1 文本挖掘定义 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 ? 2 文本挖掘步骤 1)读取数据库或本地[详细]
-
微信红包先抢和后抢差距居然这么大!春节抢红包的大数据分析
所属栏目:[大数据] 日期:2020-12-24 热度:168
副标题#e# 春节是中华民族隆重的农历新年 这是世界上规模最大的节日 在春节前后 炎黄子孙们不远万里衣锦还乡 与亲人们团圆 在此期间 中国的铁路上会发生 地球上最大规模的人口迁徙 作为世界上最能吃最能玩的种族 聪明勇敢的中国人发明了非常多的娱乐活动 比[详细]
-
NMEA library数据处理过程分析
所属栏目:[大数据] 日期:2020-12-24 热度:152
? ?今天学习一个GPS数据解析开源库——NMEA lib。使用这个库,可以轻松处理GPS接收机发出的数据,并不需要了解NMEA的具体协议,这个库可以解析所有NMEA0813规定的所有报文格式。不仅可以解析出原始数据中包含的所有参数,还可以计算两点之间的距离、方向以[详细]
-
打车不再加价?大数据说可以有
所属栏目:[大数据] 日期:2020-12-24 热度:161
副标题#e# 高峰期打车的供求关系不均衡的问题,一直被诟[详细]
-
算法训练 区间k大数查询
所属栏目:[大数据] 日期:2020-12-24 热度:178
问题描述 给定一个序列,每次询问序列中第l个数到第r个数中第K大的数是哪个。 输入格式 第一行包含一个数n,表示序列长度。 第二行包含n个正整数,表示给定的序列。 第三个包含一个正整数m,表示询问个数。 接下来m行,每行三个数l,r,K,表示询问序列从左[详细]
-
[bigdata-036] mit-scheme试用
所属栏目:[大数据] 日期:2020-12-24 热度:96
1. 安装Mit-scheme apt-get install mit-scheme 2. 写一个hello wold代码, hi.scm (begin (display "Hello,World!") (newline)) 3. 在命令行执行 scheme,进入交互界面,然后输入命令 (load 'hi.scm') 将执行这个文件,然后输出 "Hello,World!" 4. scheme[详细]
-
[bigdata-037] docker hue 用SQL获取数据以及可视化
所属栏目:[大数据] 日期:2020-12-24 热度:109
1. hue官网 https://github.com/cloudera/hue http://gethue.com/ 2. hue的功能 有py2+django开发,提供Hive,Impala,MySQL,Oracle,PostgreSQL,Spark SQL,Solr SQL,Phoenix...等SQL数据获取和页面展示 3. 用docker 安装hue docker pull gethue/hue 4. hue i[详细]
-
[bigdata-037]apache hue 用SQL获取数据以及可视化
所属栏目:[大数据] 日期:2020-12-24 热度:125
1. hue官网 https://github.com/cloudera/hue http://gethue.com/ 2. hue的功能 有py2+django开发,提供Hive,Impala,MySQL,Oracle,PostgreSQL,Spark SQL,Solr SQL,Phoenix...等SQL数据获取和页面展示 3. 用docker 安装hue docker pull gethue/hue 4. hue i[详细]
-
[bigdata-038] tushare 金融数据 安装使用
所属栏目:[大数据] 日期:2020-12-24 热度:181
1. 安装 pip install tushare 2. 获取股票的基本面 #!/usr/bin/env python3#!-*- coding:utf-8 -*-import tushare as ts#显示基本信息res = ts.get_stock_basics()print(res)print(type(res)) res是的类型是pandas.core.frame.DataFrame,3114? x 22 的矩[详细]
-
3.21.1、BI之SSIS之数据流转换(渐变维度-混合模式)
所属栏目:[大数据] 日期:2020-12-24 热度:180
BI之SSIS之数据流转换(渐变维度-混合模式) ? ? 1??????????3.21中介绍了普通模式的渐变维度,即通过时间标志来对维度属性值的变化进行记录,这种方式可以很直观的看到变化的时间点,但是在使用时却比较麻烦,因为你需要通过时间字段去判断 ? 2??????????[详细]
-
[bigdata-039] pysql+pymongo+py3把数据从sql 导入 到mongo的通
所属栏目:[大数据] 日期:2020-12-24 热度:147
#!/usr/bin/env python3#! coding:utf-8 -*-import pymysqlimport pymongodef trans_data_from_mysql_to_mongo(source_param,target_param,trans_type,where_clause,ignore_columns=[]): # 创建mysql连接 mysql_conn = pymysql.connect(host=source_param[[详细]
-
使用机器学习和大数据预测心脏病
所属栏目:[大数据] 日期:2020-12-24 热度:155
副标题#e# 编者按: 现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“ 置顶公众号”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。 大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使[详细]
-
[bigdata-040] cloudera manager web服务故障处理
所属栏目:[大数据] 日期:2020-12-24 热度:146
1. cloudera manager的web服务挂了 2. 根据文档进行重启 https://www.cloudera.com/documentation/enterprise/5-4-x/topics/cm_ag_server.html sudo service cloudera-scm-server start 无效,在10.14.x.x:7180上没有服务 lsof -i:7180上能看到端口占用。[详细]
-
HDU 2054 大数比较
所属栏目:[大数据] 日期:2020-12-24 热度:161
题目传送门:http://acm.hdu.edu.cn/showproblem.php?pid=2054 ???? ?? A这个水题也没有什么意思,主要巩固前面Java大数类和一些方法的学习。 ??? ?? 题目如果直接用Java.Biginteger.equals()方法的话会WA,在API说明里面,对于2.00,和2.0值相等,标度不[详细]
-
成为技术高手:想更了解自己的偶像么?教你用技术手段挖掘他#92
所属栏目:[大数据] 日期:2020-12-24 热度:155
点击上方“云栖社区”可以订阅哦 摘要 是否在不同的电影中,总是能看到那些熟悉却叫不上名字的演员们,想知道他们之间相互的关系么?本文将带你一步一步地挖掘出他们的关系。想更了解自己的偶像么,那就试试吧。 以下为译文 我最近换了个工作,在入职之前[详细]
-
万科房地产大数据分析平台
所属栏目:[大数据] 日期:2020-12-24 热度:95
副标题#e# 如何研究房地产市场? 归根结底需要解决的问题无非是 地、房、人三大内容 然而,传统的研究方法却耗时耗力 看不全的土地——总会遗忘疏漏 想不尽的产品——依旧经验为先 读不透的客户——往往以偏概全 上海万科率先使用先进的手段颠覆传统的研究[详细]
-
携程BI团队实践:推荐系统中基于深度学习的混合协同过滤模型
所属栏目:[大数据] 日期:2020-12-24 热度:184
副标题#e# 背景 近些年,深度学习在语音识别、图像处理、自然语言处理等领域都取得了很大的突破与成就。相对来说,深度学习在推荐系统领域的研究与应用还处于早期阶段。 携程在深度学习与推荐系统结合的领域也进行了相关的研究与应用,并在国际人工智能顶级[详细]