自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

rosefun96的博客

深度学习、算法交流q群596506387。

原创 CTR之FM模型及keras实现

class FM(Layer): """Factorization Machine models pairwise (order-2) feature interactions without linear term and bias. ...

2020-04-27 23:31:15 644 2

原创 LeetCode33. 搜索旋转排序数组(二分法,python)

1. 题目 假设按照升序排序的数组在预先未知的某个点上进行了旋转。 ( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。 搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。 你可以假设数组中不存在重复的元素。 你的算法时间复...

2020-04-27 10:02:03 72 0

原创 LeetCode23. 合并K个排序链表

1. 题目 合并 k 个排序链表,返回合并后的排序链表。请分析和描述算法的复杂度。 示例: 输入: [ 1->4->5, 1->3->4, 2->6 ] 输出: 1->1->2->3->4->4->5->6 来...

2020-04-26 10:14:26 67 0

原创 LeetCode2. 小张刷题计划

1. 题目 为了提高自己的代码能力,小张制定了 LeetCode 刷题计划,他选中了 LeetCode 题库中的 n 道题,编号从 0 到 n-1,并计划在 m 天内按照题目编号顺序刷完所有的题目(注意,小张不能用多天完成同一题)。 在小张刷题计划中,小张需要用 time[i] 的时间完成编号 i...

2020-04-25 22:03:28 347 0

原创 LeetCode874. 模拟行走机器人(python,普通遍历题)

1. 题目 机器人在一个无限大小的网格上行走,从点 (0, 0) 处开始出发,面向北方。该机器人可以接收以下三种类型的命令: -2:向左转 90 度 -1:向右转 90 度 1 <= x <= 9:向前移动 x 个单位长度 在网格上有一些格子被视为障碍物。 第 i 个障碍物位于网格点...

2020-04-23 13:10:36 167 0

转载 不平衡样本对SVM的影响

样本失衡会对SVM的影响 假设正类样本远多于负类 1、线性可分的情况 假设真实数据集如下: 由于负类样本量太少,可能会出现下面这种情况 使得分隔超平面偏向负类。严格意义上,这种样本不平衡不是因为样本数量的问题,而是因为边界点发生了变化 2、线性不可分的情况 源数据以及理想的超平面情况如下: 很可能...

2020-04-22 17:10:56 379 0

原创 LeetCode 面试题63. 股票的最大利润

1. 题目 假设把某股票的价格按照时间先后顺序存储在数组中,请问买卖该股票一次可能获得的最大利润是多少? 示例 1: 输入: [7,1,5,3,6,4] 输出: 5 解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。 ...

2020-04-21 18:01:48 174 0

原创 LeetCode面试题42. 连续子数组的最大和

1. 题目 输入一个整型数组,数组里有正数也有负数。数组中的一个或连续多个整数组成一个子数组。求所有子数组的和的最大值。 要求时间复杂度为O(n)。 示例1: 输入: nums = [-2,1,-3,4,-1,2,1,-5,4] 输出: 6 解释: 连续子数组 [4,-1,2,1] 的和最大,为 ...

2020-04-21 16:35:22 82 0

原创 LeetCode面试题 08.01. 三步问题(简单,动态规划,python)

1. 题目 三步问题。有个小孩正在上楼梯,楼梯有n阶台阶,小孩一次可以上1阶、2阶或3阶。实现一种方法,计算小孩有多少种上楼梯的方式。结果可能很大,你需要对结果模1000000007。 示例1: 输入:n = 3 输出:4 说明: 有四种走法 来源:力扣(LeetCode) 链接:ht...

2020-04-21 16:25:46 125 0

原创 LeetCode面试题 17.16. 按摩师(python,动态规划)

1. 题目 一个有名的按摩师会收到源源不断的预约请求,每个预约都可以选择接或不接。在每次预约服务之间要有休息时间,因此她不能接受相邻的预约。给定一个预约请求序列,替按摩师找到最优的预约集合(总预约时间最长),返回总的分钟数。 注意:本题相对原题稍作改动 示例 1: 输入: [1,2,3,1] 输出...

2020-04-21 16:08:58 133 0

原创 LeetCode375. 猜数字大小 II(python,动态规划)

1. 题目 我们正在玩一个猜数游戏,游戏规则如下: 我从 1 到 n 之间选择一个数字,你来猜我选了哪个数字。 每次你猜错了,我都会告诉你,我选的数字比你的大了或者小了。 然而,当你猜了数字 x 并且猜错了的时候,你需要支付金额为 x 的现金。直到你猜到我选的数字,你才算赢得了这个游戏。 示例: ...

2020-04-21 15:19:29 150 0

原创 C++系列: 常见数据结构与C++实现(9)

1. 线性表 顺序表 #include <iostream> #include <vector> using namespace std; void print_vector(vector<auto> vec){ for (auto i:vec){ co...

2020-04-21 13:30:23 74 0

原创 常见数据结构与python实现

python重要的数据结构list 可以实现线性表,队列,栈等。 1. 线性表 顺序表 size = 10 array = [0 for i in range(size)] 链表 class ListNode: def __init__(self,x): self.val = x se...

2020-04-21 12:16:05 268 0

原创 LeetCode743. 网络延迟时间(python,bfs)

1. 题目 有 N 个网络节点,标记为 1 到 N。 给定一个列表 times,表示信号经过有向边的传递时间。 times[i] = (u, v, w),其中 u 是源节点,v 是目标节点, w 是一个信号从源节点传递到目标节点的时间。 现在,我们从某个节点 K 发出一个信号。需要多久才能使所有节...

2020-04-21 11:32:20 114 0

原创 LeetCode1248. 统计「优美子数组」

1. 题目 给你一个整数数组 nums 和一个整数 k。 如果某个 连续 子数组中恰好有 k 个奇数数字,我们就认为这个子数组是「优美子数组」。 请返回这个数组中「优美子数组」的数目。 示例 1: 输入:nums = [1,1,2,1,1], k = 3 输出:2 解释:包含 3 个奇数的子数组是...

2020-04-21 08:31:49 177 1

原创 LeetCode103. 二叉树的锯齿形层次遍历

1. 问题 给定一个二叉树,返回其节点值的锯齿形层次遍历。(即先从左往右,再从右往左进行下一层遍历,以此类推,层与层之间交替进行)。 例如: 给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7 返回锯齿形层...

2020-04-20 23:46:51 56 0

原创 LeetCode200. 岛屿数量(python,bfs)

1. 题目 给你一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,请你计算网格中岛屿的数量。 岛屿总是被水包围,并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。 此外,你可以假设该网格的四条边均被水包围。 示例 1: 输入: 11110 11010 11000 00000 输出...

2020-04-20 10:40:20 160 0

原创 LeetCode123. 买卖股票的最佳时机 III(python,动态规划)

1. 题目 给定一个数组,它的第 i 个元素是一支给定的股票在第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你最多可以完成 两笔 交易。 注意: 你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 示例 1: 输入: [3,3,5,0,0,3,1,4] 输出: 6 解释:...

2020-04-19 19:36:03 103 0

原创 LeetCode 122. 买卖股票的最佳时机 II(动态规划,python)

1. 题目 给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格。 设计一个算法来计算你所能获取的最大利润。你可以尽可能地完成更多的交易(多次买卖一支股票)。 注意:你不能同时参与多笔交易(你必须在再次购买前出售掉之前的股票)。 示例 1: 输入: [7,1,5,3,6,4] 输出: 7...

2020-04-19 18:38:39 253 0

原创 最大公约数

辗转相除法/欧几里得算法: def gcd(a,b): if b == 0: return a return gcd(b, a%b) print(gcd(6,9)) 相减法: def gcd(a,b): if b>a: tmp = a...

2020-04-16 18:43:46 265 0

原创 二项分布累积分布函数绘制

1. 二项分布 2. 示例 投篮n次;投中概率0.1。 import matplotlib.pyplot as plt import numpy as np from scipy.special import comb, perm from scipy import integrate f...

2020-04-16 13:10:24 1585 0

原创 pomegranate包实现贝叶斯网络

1. 包安装 pip install pomegranate==0.10 2. 示例 from pomegranate import * import numpy as np mydb=np.array([[1,2,3],[1,2,4],[1,2,5],[1,2,6],[1,3,8],[2,...

2020-04-15 18:56:20 578 0

原创 浅谈BERT

1. 背景 BERT是预训练模型,能够显著提高下游任务效果,不使用label样本。 成功的原因在于, 代理任务的积累 从简单的CBOW, skipgram,最终到 Masked-LM,nsp。 深层网络 越是深层、大容量的网络,越能抽取高层的特征、存储更丰富的知识,Re...

2020-04-15 14:15:39 273 0

原创 Keras Bert实践

1. keras-bert包 安装 pip install keras-bert 示例: 训练模型: import keras from keras_bert import get_base_dict, get_model, compile_model, gen_batch_inputs #...

2020-04-15 13:27:52 604 0

原创 LeetCode 542. 01 矩阵

1. 题目 给定一个由 0 和 1 组成的矩阵,找出每个元素到最近的 0 的距离。 两个相邻元素间的距离为 1 。 示例 2: 输入: 0 0 0 0 1 0 1 1 1 输出: 0 0 0 0 1 0 1 2 1 注意: 给定矩阵的元素个数不超过 10000。 给定矩阵中至少有一个元素是...

2020-04-15 08:59:03 48 0

原创 Hadoop配置伪分布式模式(2)

1. 简介 Hadoop有三种运行模式。 HDFS包含一个NameNode,充当集群协调者的角色,是一个或多个用于存储数据的DataNode的管理者。 Hadoop有3种模式部署组件。 本地独立模式 默认工作模式。Hadoop组件都运行在同一个Java进程中。 伪分布式模式 Hadoop的各个组...

2020-04-14 23:41:10 69 0

原创 Spark决策树算法预测实现(Scala语言)

1. 准备数据 使用网上的Covtype 数据集,包含csv格式压缩数据文件 covtype.data.gz; 解压缩: gzip covtype.data.gz -d 数据集记录科罗拉多州不同地块的森林植被类型。 Spark MLlib将特征抽象为 LabeledPoint; 由包含多个特征值...

2020-04-14 14:59:59 211 0

原创 Scala语法、数据类型、变量

1. 基本语法 类名 类名第一个字母要大写 示例: class MyFirstScalaClass 方法名称 第一个字母要小写 示例:def myMethodName() 程序文件名 程序名和对象名称匹配。 如, HelloWorld.scala def main(args:Arr...

2020-04-14 00:09:40 52 0

原创 Scala入门

1.安装 见菜鸟教程 Scala 安装;

2020-04-13 23:50:12 41 0

原创 Jupyter notebook安装Scala

1. 前言 使用spark框架一般用Scala,python等语言写。jupyter notebook下安装Scala,能很好等实现在Spark框架写运行代码。 2. 实现 pip install spylon-kernel python -m spylon_kernel install ju...

2020-04-13 23:33:44 316 0

原创 Spark内置逻辑斯谛回归LR实现(python)

1. Spark版LR from pyspark.ml import Pipeline from pyspark.ml.classification import LogisticRegression from pyspark.ml.linalg import Vectors spark.conf...

2020-04-13 23:17:07 92 0

原创 Spark RDD编程 python版本(2)

1. 创建RDD 并行集合进行创建,或者读取外部文件进行创建 rdd = sc.textFile('/data/word.txt') nums = [1,2,3,4,5] rdd = sc.parallelize(nums) 2. RDD操作 转换: 操作 含义 ...

2020-04-13 21:09:25 43 0

原创 Spark2.4.5词频统计(python)

使用jupyter notebook作为交互工具,python语言写。 代码 sc.textFile()用于加载文件数据。 words = sc.textFile('/data/word.txt') 结果: /data/word.txt MapPartitionsRDD[3]...

2020-04-13 16:34:26 208 0

原创 Spark第一个程序

1. 安装 Linux环境 使用pyspark 和jupyter notebook作为交互工具。 具体看 Spark 初入门. 2. 第一个程序 计算圆周率: import random num_samples = 100000000 def inside(p): x, y = r...

2020-04-13 15:53:08 69 0

原创 Hadoop的第一个程序

1. 安装 环境 Ubuntu 步骤: (1) 安装JDK Hadoop是用Java实现的,首先安装Java开发工具包(JDK) 检查JDK是否可用: $ javac $ java -version 一旦安装好,添加 JDK/bin 路径。 通过以下命令查找 JDK 安装路径: ls -lrt ...

2020-04-13 13:28:39 68 0

原创 C++系列: 顺序容器(7)

1. 概述 容器名称 性质 vector 可变大小数组,支持快速随机访问,在尾部之外插入或删除元素可能很慢 deque 双端队列,快速随机访问,头尾插入、删除很快 list 双向链表,只支持双向顺序访问,list任何位置插入,删除很快 forward_list 单向链表...

2020-04-13 10:19:26 35 0

原创 C++系列:关于类(4)

1. 简介 类的基本思想是数据抽象和封装。数据抽象是一种依赖于接口和实现分类的编程技术。 类的接口包含用户所能执行的操作; 类的实现包含类的数据成员、负责接口实现的函数体以及定义类所需的各种私有函数。 封装实现类的接口和实现的分类。类的用户只能使用接口而无法访问实现部分。 类需要首先定义一个抽象数...

2020-04-13 09:22:29 32 0

原创 C++系列:switch语句(5)

1. switch switch case 语句由于会跳过一些case;因此,在作用域外,变量只能定义,不能初始化。 #include <iostream> using namespace std; int main(){ bool b = false; switch(b){ ...

2020-04-13 08:56:29 33 0

原创 LeetCode面试题55 - I. 二叉树的深度(C++,递归)

1. 问题 输入一棵二叉树的根节点,求该树的深度。从根节点到叶节点依次经过的节点(含根、叶节点)形成树的一条路径,最长路径的长度为树的深度。 例如: 给定二叉树 [3,9,20,null,null,15,7], 3 / \ 9 20 / \ 15 7 返回...

2020-04-12 18:48:07 143 0

原创 LeetCode面试题 04.02. 最小高度树(C++,递归)

1. 题目 给定一个有序整数数组,元素各不相同且按升序排列,编写一个算法,创建一棵高度最小的二叉搜索树。 示例: 给定有序数组: [-10,-3,0,5,9], 一个可能的答案是:[0,-3,9,-10,null,5],它可以表示下面这个高度平衡二叉搜索树: 0 ...

2020-04-12 18:36:52 85 0

提示
确定要删除当前文章?
取消 删除