大数据

【python基础】五大数据类型及常用方法

1. 数据类型概述    python中的字符串,列表,元组,字典,集合这五种数据类型均是可迭代的,可以使用for循环访问,涵盖了三类数据结构分别为序列、散列、集合。   序列:      字符串 str      列表 list()      元组 tuple()   散列:       »

wang-technology

活字格性能优化技巧(2)-如何在大规模数据量的场景下提升数据访问效率

在上节内容中我们介绍了如何利用数据库主键提升访问性能,本节内容我们继续为大家介绍如何在大规模数据量的场景下提升数据访问效率。 在开始之前先做个小小的实验: 1. 准备一张数据表,内置1000W行记录。 2. 直观感受一下这个表的规模。使用MSSQL对其进行查询,足足花了8秒钟的时间才获取到表的总行数 »

大神之路-起始篇 | 第3章.计算机科学导论之【数据存储】学习笔记

[ 点击 ? 关注「 全栈工程师修炼指南」公众号 ] 设为「⭐️ 星标」带你从基础入门 到 全栈实践 再到 放弃学习! 涉及 网络安全运维、应用开发、物联网IOT、学习路径 、个人感悟 等知识分享。 希望各位看友多多支持【关注、点赞、评论、收藏、投币】,助力每一个梦想。 【WeiyiGeek B »

大数据之Spark基础环境

目录 前言 一、Spark概述 (一)Spark是什么 (二)Spark的四大特点 (三)Spark的风雨十年 (四)Spark框架模块 (五)Spark通信框架 总结 前言 本篇文章开始介绍Spark基础知识,包括Spark诞生的背景,应用环境以及入门案例等,还是Spark学习之旅 »

MySQL中存储的数据查询的时候怎么区分大小写

这篇文章主要介绍了MySQL中存储的数据查询的时候怎么区分大小写的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇MySQL中存储的数据查询的时候怎么区分大小写文章都会有所收获,下面我们一起来看看吧。 场景描述 今天在将 Hive 表同步到 MySQL 之后,其中有一列是 »

GaussDB(DWS)网络调度与隔离管控能力

摘要:调度算法是调度器的核心,设计调度算法要充分考虑业务场景和用户需求,没有万能的调度算法,只有合适的调度算法。 本文分享自华为云社区《GaussDB(DWS)网络调度与隔离管控能力》,作者:门前一棵葡萄树。 一、常见的调度算法 QoS(Quality of Service)即服务质量,是一种调度控 »

MySQL中存储的数据查询的时候如何区分大小写

目录 场景描述 解决办法 1. 查询时指定大小写敏感 2. 定义表结构时指定字段大小写敏感 3. 修改排序规则(COLLATE) COLLATE是用来做什么的? 各种COLLATE的区别 COLLATE 设置级别及其优先级 总结 场景描述 今天在将 Hive 表同步到 MySQL »

MySQL中存储的数据查询的时候如何区分大小写

目录 场景描述 解决办法 1. 查询时指定大小写敏感 2. 定义表结构时指定字段大小写敏感 3. 修改排序规则(COLLATE) COLLATE是用来做什么的? 各种COLLATE的区别 COLLATE 设置级别及其优先级 总结 场景描述 今天在将 Hive 表同步到 MySQL »

ORACLE大批量插入数据的详细步骤

目录 尝试了一下几种方式: 一.关闭日志,数据追加模式 二:PARALLEL模式(并行进程数要谨慎 ) 总结 最近有几张表随着时间不断的增长,表中的数据量也越来越大,想把原来的表改成分区表,需要两个步骤: 一:建立分区表 二:把源表的数据迁移到分区表中 但是源表的数据量是1亿的数据 »

ORACLE大批量插入数据的详细步骤

目录 尝试了一下几种方式: 一.关闭日志,数据追加模式 二:PARALLEL模式(并行进程数要谨慎 ) 总结 最近有几张表随着时间不断的增长,表中的数据量也越来越大,想把原来的表改成分区表,需要两个步骤: 一:建立分区表 二:把源表的数据迁移到分区表中 但是源表的数据量是1亿的数据 »

云上大数据存储:探究 JuiceFS 与 HDFS 的异同

HDFS 作为 Hadoop 提供存储组件,已经成为大数据生态里面数据存储最常用的选择,通常在机房环境部署。 JuiceFS 是一个基于对象存储的分布式文件系统,用户可以在云上快速地搭建按需扩容的弹性文件系统。 如果企业正在考虑在云上构建大数据平台,了解这两种产品的差异和优缺点,可以为企业迁移或切换 »

JuiceData

云上大数据存储:探究 JuiceFS 与 HDFS 的异同

HDFS 作为 Hadoop 提供存储组件,已经成为大数据生态里面数据存储最常用的选择,通常在机房环境部署。 JuiceFS 是一个基于对象存储的分布式文件系统,用户可以在云上快速地搭建按需扩容的弹性文件系统。 如果企业正在考虑在云上构建大数据平台,了解这两种产品的差异和优缺点,可以为企业迁移或切换 »

JuiceData

面试题锦集:1、数据库三大范式,2、mysql索引类型及作用,3、事务的特性和隔离级别

目录 面试题集锦 一、数据库三大范式 二、mysql有哪些索引类型及作用 三、事务的特性和隔离级别 1、事务的四大特性 2、事务的隔离级别 3、什么是脏读、不可重复度、幻读 4、解决办法 面试题集锦 一、数据库三大范式 第一范式(1NF): 指数据库中表的每一列都是不可分割的最小单 »

'林子雨大数据' 实验3 HBase操作与接口编程

“林子雨大数据” 实验3 HBase操作与接口编程 环境搭建 VM虚拟机和Ubuntu系统的安装 在Windows中使用VirtualBox安装Ubuntu虚拟机(2020年7月版本)_厦大数据库实验室博客 (xmu.edu.cn) Hadoop安装(伪分布式) Hadoop3.1.3安装教程_单机 »

火山引擎 A/B 测试产品——DataTester 私有化架构分享

作为一款面向 ToB 市场的产品——火山引擎A/B测试(DataTester)为了满足客户对数据安全、合规问题等需求,探索私有化部署是产品无法绕开的一条路。 在面向 ToB 客户私有化的实际落地中,火山引擎A/B测试(DataTester)也遇到了字节内部服务和企业 SaaS 服务都不容易遇到的问题 »

bytedata

FlinkSQL自定义函数开发

本次需求场景主要为实现将flinksql中collect()函数输出的Mutiset(VARCHAR<100>)多行结果转换为字符串。 一、FlinkSQL自定义函数分类 Flink SQL 的自定义函数是用户可以自行编写的一种函数,用于扩展 Flink SQL 的功能。自定义函数可以在 »

wxm2270

JS封装转换前后端接口数据格式工具函数下划线<=>大写

目录 一、前言 二、思路 三、代码 四、效果 结语 一、前言 这段时间接近年底,公司的业务也不是很繁忙,有些闲暇的时间,就模仿ruoyi写一个后台系统,技术栈前端是react18,后端为koa2; 在一个接口返回数据的过程中,遇到一个问题,就是后端数据保存到数据库中的命名标准是下划线 »

JS封装转换前后端接口数据格式工具函数下划线<=>大写

目录 一、前言 二、思路 三、代码 四、效果 结语 一、前言 这段时间接近年底,公司的业务也不是很繁忙,有些闲暇的时间,就模仿ruoyi写一个后台系统,技术栈前端是react18,后端为koa2; 在一个接口返回数据的过程中,遇到一个问题,就是后端数据保存到数据库中的命名标准是下划线 »

手把手带你从0完成医疗行业影像图像检测三大经典模型InceptionV3-RestNet50-VGG16(附python源代码及数据库)——改变世界经典人工智能项目实战(一)手把手教学迁移学习

如果你想使用现在最火的ChatGPT来训练属于你的专属ChatGPT模型,那你千万不能错过这篇文章。迁移学习是机器学习领域中的一种重要方法,它通过利用先前的学习经验来提高当前任务的性能。本文通过3个经典的模型:InceptionV3-RestNet50-VGG16作为示例,为大家从0开始搭建了医疗影 »