最新要闻
- 全球快播:联想首款GeekPro游戏本真机公布:1TB SSD 超高性价比
- 环球微头条丨我国研发人员总量稳居世界首位 顶尖科技人才加速涌现
- 跑着跑着天窗会掉 奔驰中国召回超2万辆汽车
- 68岁成龙18年后再拍《神话2》 定名《传说》 古力娜扎主演
- 观速讯丨外卖员穿工装禁入成都高端商场 成都SKP回应:内部规定
- 焦点日报:135期 手绘汽车壁纸|插画 卫士还是老款好看 路虎卫士无水印手机壁纸
- 当前速讯:手机端ChatGPT搜索来了!微软2周火速上线 @Bing即用
- 多辆房车霸占高速服务区露营:有车主搭帐篷还晒咸菜
- 魔兽等游戏停服一个月 暴雪真不着急:两家中国公司抢破头
- 环球聚焦:《龙之家族》第二季明年首播
- 晨光文具批发总部电话_石家庄晨光办公用品有限公司
- 环球要闻:新款特斯拉Model 3实车谍照曝光:疑似加长、内饰大改
- 可口可乐风味饮品!柠檬道日式气泡酒大促:12罐不到30元
- 前沿资讯!《嗜血印》将推出女祭司1/4比例雕像 性感热辣吸睛
- 焦点快播:送礼新思路!淘宝公布2023年度丑东西:网红青蛙服入选“年度五丑”
- 名山大川是什么意思?名山大川有哪些?
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
【世界热闻】单特征线性回归
单特征线性回归
线性回归模型是回归模型的一种,通常用于预测数据。
一、模型
二、成本函数的使用
线性回归的目标是找到合适的w、b,使成本函数的值最小,让假设函数直线与训练集拟合最好。成本函数是衡量预测值与真实值之间的差异,也即误差,误差越小,预测的结果自然更接近真实值。
(相关资料图)
以下将展示成本函数与参数的可视化图形。
1.简化的假设函数,f=wx:
2.完整的假设函数,f=wx+b:
在同一条等高线上,可能有多种不同的参数w、b使成本函数值相等,这样并不利于预测。在这样碗状图形的最底部或最低点,成本函数的值是最小的,也是唯一的。
三、梯度下降
如何寻找最合适的参数w、b?虽然我们已经理解最低处是使成本函数最小的点,但是直接利用可视化图形去读取,这在复杂的模型中显然是不可取的。此时,就要利用到梯度下降算法,它是机器学习中最重要的算法之一。实际上,梯度下降算法不仅仅适用于回归模型,它适用于几乎所有多参数模型。
1、思想
从起始点开始梯度下降,每走一步都选择梯度下降最快的点,直至到达局部最低点。
2、梯度下降算法的实现
每下降一次就更新一次参数w、b。到达局部最低点以后,w、b的值将不再变化。
3、梯度下降的理解
梯度下降的任务是找到最小化成本函数的参数w、b。
以简化模型为例,只有一个参数w时:
4、学习率的选择
当学习率过小时,下降的步子过小,导致到达最低点需要很多步,需要的时间也更多;
当学习率过大时,下降的步子较大,可能越过最低点,导致越来越远,甚至永远也到达不了最低点。
为什么我们可以采用固定的学习率?因为越靠近最低点,斜率将会越来越小,等于迈的步子越来越小了,最终也会慢慢靠近最低点。
四、线性回归的梯度下降
1、微积分的推导
2、梯度下降
3、差异
在梯度下降中,成本函数可能存在多个局部最小值,但是对于线性回归而言,成本函数只有一个全剧最小点。
所以在线性回归模型中,只要学习率选择得当,成本函数总是会收敛于全局最小值。
4、批量梯度下降
批量梯度下降指的是在梯度下降的每一步,我们都会考虑所有的训练样本,而不是训练数据的一个子集。事实上,还有其他的梯度下降算法在下降时仅仅考虑训练数据的一个子集,在这里我们采用批量梯度下降的方法处理线性回归模型。
五、实现
部分数据集和完整代码
6.1101,17.5925.5277,9.13028.5186,13.6627.0032,11.8545.8598,6.82338.3829,11.8867.4764,4.34838.5781,126.4862,6.59875.0546,3.81665.7107,3.252214.164,15.5055.734,3.1551.......
""" 在本练习的这一部分,您将使用单变量实现线性回归,以预测食品卡车的利润。 假设你是一家餐饮连锁店的首席执行官,正在考虑在不同的城市开设新的分店。这家连锁店已经在各个城市拥有卡车,你可以从这些城市获得利润和人口数据。您希望使用这些数据来帮助您选择下一步要扩展到哪个城市。文件ex1data1.txt包含线性回归问题的数据集。第一列是一个城市的人口,第二列是该城市食品卡车的利润。利润为负值表示亏损。"""import numpy as npimport pandas as pdimport matplotlib.pyplot as plt# 导入数据path = r"data/ex1data1.txt"data = pd.read_csv(path, header=None, names=["Population", "Profit"])# 在训练集中索引为0处添加一列,以便我们可以使用向量化的解决方案来计算代价和梯度,值为1,命名为“ones”data.insert(0, "ones", 1)# 取数据集列数:3cols = data.shape[1] # df.shape返回的是一个元组(97,3),97表示行数,3表示列数X = data.iloc[:, 0:cols - 1] # 提取数据集除最后一列外的所有数据y = data.iloc[:, cols - 1:cols] # 提取数据集最后一列的数据# 转换成numpy的矩阵格式X = np.matrix(X.values) # 97x2的矩阵 y = np.matrix(y.values) # 97x1的矩阵# theta存放参数w、b,初始化为0theta = np.matrix(np.array([0, 0])) # 一个1x2矩阵(0 0)alpha = 0.0001 # 学习速率αiters = 1000 # 下降的步数。def computeCost(X, y, theta): """代价函数""" linear = np.power(((X * theta.T) - y), 2) # np.power(x,y),计算x的y次方 cost = np.sum(linear) / (2 * len(X)) return costdef gradientDescent(X, y, theta, alpha, iters): """梯度下降法""" # 存放参数w、b的中间量 temp = np.matrix(np.zeros(theta.shape)) # np.zeros生成一个给定形状和类型的用0填充的数组 # 参数的个数 parameters = int(theta.ravel().shape[1]) # ravel:扁平化函数,矩阵变成1行N列 # # 生成一个包含iters个0的数组,用于存放每一次下降后的成本 cost = np.zeros(iters) # 迭代iters次 for i in range(iters): error = (X * theta.T) - y # 表示成本f(w,b) - y # 更新参数w、b。(j为0时表示更新b,j为1时表示更新w,theta为存放参数w、b的矩阵[b w]) for j in range(parameters): term = np.multiply(error, X[:, j]) # (f(w,b) - y )* x(j) temp[0, j] = theta[0, j] - (alpha / len(X)) * np.sum(term) theta = temp #计算成本 cost[i] = computeCost(X, y, theta) # 返回更新iters次后的theta,以及每次下降后的代价值 return theta, cost print("theta初始值为0的成本值为:",computeCost(X,y,theta))# 开始梯度下降g, cost = gradientDescent(X, y, theta, alpha, iters)print("更新{}次后的成本值为:".format(iters), computeCost(X, y, g))# 构造假设函数x = np.linspace(data.Population.min(), data.Population.max(), 100) # 从最小值到最大值之间均匀的取100个值h = g[0, 0] + (g[0, 1] * x) # 假设函数# 绘制训练集散点图和拟合直线fig, ax = plt.subplots(figsize=(12, 8))ax.plot(x, h, "r", label="Prediction") #绘制假设函数拟合的直线ax.scatter(data.Population, data.Profit, label="Traning Data") # 训练集散点图ax.legend(loc=2)ax.set_xlabel("Population")ax.set_ylabel("Profit")ax.set_title("Predicted Profit VS. Population Size")plt.show()# 绘制学习曲线fig, ax = plt.subplots(figsize=(12, 8))ax.plot(np.arange(iters), cost, "r") # 观察成本函数下降情况ax.set_xlabel("Iterations")ax.set_ylabel("Cost")ax.set_title("Error vs. Training Epoch")plt.show()
【世界热闻】单特征线性回归
全球实时:为什么说《ps1屠龙刀》是awk、sed的恩人?
天天最资讯丨C语言在线代码运行编译工具推荐
全球快播:联想首款GeekPro游戏本真机公布:1TB SSD 超高性价比
环球微头条丨我国研发人员总量稳居世界首位 顶尖科技人才加速涌现
跑着跑着天窗会掉 奔驰中国召回超2万辆汽车
68岁成龙18年后再拍《神话2》 定名《传说》 古力娜扎主演
观速讯丨外卖员穿工装禁入成都高端商场 成都SKP回应:内部规定
焦点日报:135期 手绘汽车壁纸|插画 卫士还是老款好看 路虎卫士无水印手机壁纸
每日快讯!手把手教你为基于Netty的IM生成自签名SSL/TLS证书
当前热门:《我想进大厂》之Spring夺命连环10问
《分布式技术原理与算法解析》学习笔记Day20
世界看点:数据治理如何做?火山引擎DataLeap帮助这款产品3个月降低计算成本20%
世界今头条!装饰器设计模式这样学,保你必懂!
当前速讯:手机端ChatGPT搜索来了!微软2周火速上线 @Bing即用
多辆房车霸占高速服务区露营:有车主搭帐篷还晒咸菜
魔兽等游戏停服一个月 暴雪真不着急:两家中国公司抢破头
P1219 [USACO1.5]八皇后 Checker Challenge
世界新资讯:Java单元测试浅析(JUnit+Mockito)
81python装饰器
环球聚焦:《龙之家族》第二季明年首播
环球播报:Nginx基础03:配置文件nginx.conf(Part2)
【独家焦点】Python工具箱系列(二十六)
有奖调研!第五期(2022-2023)传统行业云原生技术落地调研——金融篇
全球快资讯丨A/B 测试成为企业“新窗口”:增长盈利告别经验主义,数据科学才是未来
晨光文具批发总部电话_石家庄晨光办公用品有限公司
环球要闻:新款特斯拉Model 3实车谍照曝光:疑似加长、内饰大改
可口可乐风味饮品!柠檬道日式气泡酒大促:12罐不到30元
前沿资讯!《嗜血印》将推出女祭司1/4比例雕像 性感热辣吸睛
焦点快播:送礼新思路!淘宝公布2023年度丑东西:网红青蛙服入选“年度五丑”
天天快报!C# Socket 通信时,怎样判断 Socket 双方是否断开连接
易基因|ChIP-seq等组学研究鉴定出结直肠癌的致癌超级增强子:Nature子刊
报道:顶象APP加固的“蜜罐”技术有什么作用
为什么带NOLOCK的查询语句还会造成阻塞
全球今亮点!支付宝二面:使用 try-catch 捕获异常会影响性能吗?大部分人都会答错!
名山大川是什么意思?名山大川有哪些?
喜欢被剧透的人是什么心理?喜欢被剧透的人是什么倾向?
每日快报!58岁清华毕业找不到超5000元工作 网友:我不是清华的咋办
天天热门:爷青结!《DNF》端游正式更名《地下城与勇士:创新世纪》:图标、文字调整
全球即时:《原子之心》优化非常好 但Xbox Series S仍存掉帧问题
精致又简约!雷孜LaCie新棱镜移动硬盘评测:速度全程稳如初
小米13 Ultra手机壳曝光:中分四摄、凸起严重
戴拿奥特曼飞鸟信扮演者怎么了?戴拿奥特曼的结局是什么?
四要十不准是什么意思?四要十不准内容有哪些?
童话故事是什么文体?出自童话故事的成语有哪些?
八门神器怎么打不开?八门神器使用教程
格兰仕电烤箱功能及使用方法有哪些?格兰仕电烤箱售后电话是多少?
智能abc输入法属于什么码?智能abc怎么打空格?
联想p700怎么样?联想p700手机参数?
thinkpad平板电脑怎么样?thinkpad平板电脑推荐
天天头条:Linux视频上传及压缩
Java 在线代码运行编译工具推荐
湖北长江产投将入股?集度汽车:正常交流活动
会员收入创单季最高!龚宇:爱奇艺已解决债务问题
每日焦点!原味、藤椒味 肉香酥脆:亚明农家小酥肉15元/斤狂促
【环球报资讯】大批玩家称玩《原子之心》恶心想吐!官方称将更新FOV设置
手机的飞行模式还有这些妙用!看到不点开后悔一生
【环球报资讯】C# 获取电脑内存、CPU信息
今热点:塔吉克斯坦发生7.2级地震:新疆多地震感强烈
简讯:世界第二大啤酒制造商!比尔盖茨收购喜力啤酒股份:花了62亿
环球讯息:一周扭转广告业务无果:马斯克再裁数十名Twitter员工
御香山
环球热资讯!邓超主演!《中国乒乓》出品人回应票房不如预期:希望接下来能卖多少是多少
当前观察:洗衣机买波轮还是滚筒 答案你一定想不到
世界热头条丨销量下滑45岁以上买断工龄?上汽通用辟谣:无裁员计划
腾讯自研!开放世界生存手游《黎明觉醒:生机》开服:不限号不删档
环球即时看!iPhone 15真机照首曝:刘海屏时代终结 灵动岛成标配
读Java实战(第二版)笔记18_基于Lambda的领域特定语言
沪上阿姨外包装旗袍图被质疑不雅 开叉至大腿根部不正常?官方回应
008 - 检验 (1)
JVM基础学习笔记
当前快报:Nvidia宣布GeForceNow将获得RTX服务器
天天日报丨辣椒越皱 就越辣?科学家好好研究了一番
全球时讯:128位《王者荣耀》选手通过职业技能等级考试 获“电子竞技员”证书
世界滚动:风云气象卫星今年两连发:中国将成全世界唯一!
【当前热闻】有开机广告用户照样买 全球电视销量TOP5 中国产占3席
Intel 56核心发烧U跑分逼近AMD 64核心:峰值功耗1100W!
世界热头条丨易企盈控股集团 深圳有限公司_对于易企盈控股集团 深圳有限公司简单介绍
fusion app自定义事件源码介绍(下)
Spring IOC官方文档学习笔记(十二)之基于Java的容器配置
【世界热闻】Flink之间的组件通信
Model 3还要便宜 分析师看衰特斯拉:不降价达不到目标
爱奇艺:《狂飙》热度刷新历史纪录 会员规模有信心继续增长
焦点热讯:Shell常用命令与脚本实例
每日热门:【算法训练营day58】LeetCode739. 每日温度 LeetCode496. 下一个更大元素
(三)浅谈人工智能:烽烟四起
【世界播资讯】Spark系列 - (2) Spark核心概念
每日简讯:ChatGPT承认:对人文学科 有3个负面影响
环球速讯:美女UP主买理想ONE一年血亏10万 欲哭无泪:我也要去维权
【算法训练营day57】LeetCode647. 回文子串 LeetCode516. 最长回文子序列
当前最新:006 - 数据类型、来源和清洗
焦点热议:跨境电商平台公布海外数字化展会首批重点名单 涵盖新能源等多个外贸核心行业
热讯:女孩用吹风机吹头发:插座处突然着火
播报:RTX 4060售价6999元 七彩虹将星X15 AT游戏本图赏
130MB/s读写稳如磐石!希捷酷玩系列蜘蛛侠特别版游戏硬盘2TB评测:RGB超有范儿
第七章 程序是在何种环境下运行的
二八轮动策略:基础与改进
Python迭代器是啥?
【世界速看料】学习笔记——Git命令
世界时讯:Vue相关笔记