科学 Python
首页
博客
学习
工具
峰会
稀疏数据
峰会后续 6 月 17 日
峰会后续 6 月 17 日
2023 年 6 月 17 日星期五,UTC 时间 14:00 至 15:00
#
与会者
#
Dan
Erik
Isaac
CJ
Julien
议程
#
整理并分配
待办事项
类似数组的稀疏数组的路线图/计划
矩阵的弃用计划
创建例程
与其他稀疏矩阵包的互操作性 (Isaac)
博客文章
笔记
#
介绍,Erik 从事使用稀疏数据结构的库开发
[Julien] Erik:这是
峰会的日志
待办事项
#
我们如何工作
[Dan] 进行中的工作放在哪里
CJ 的分支,在该分支上创建 PR
使用 GitHub 上的差异视图可以防止创建虚假的草稿 PR
伪装成稀疏的稠密数据可以是短暂的,不需要进入 scipy
Dan 将创建一个用于探索的分支,人们可以 fork 并向其发送 PR。Dan 还将尝试使其与主分支保持最新。
1d 稀疏数组支持时间线?- Dan 和 CJ 正在处理 - 目标版本 1.12
nd 稀疏数组支持
Julien、CJ:这似乎优先级较低,并且对于相对少见的用例而言,这将给 SciPy 带来巨大的维护成本
CJ:数组 API 使互操作更容易,我们可以暂时依赖外部包
创建函数
scipy#18592
希望在单个版本中发布它们
Ross 会实现这些功能吗,还是需要分配给其他人?
当前计划:
_array
方法,因此我们可以将其应用于相同类型的 fast_matrix_market io
捆绑 API 更改(例如形状的元组)
弃用
isspmatrix_
方法?
听起来像是类 + 格式属性的组合涵盖了这一点
(Julien) 弃用计划:已建议使用代码替换这些内容
在文档中添加一个部分,解释语义更改以及弃用周期中下游库的迁移计划。
为数组 API 创建路线图
scikit-learn
scikit-learn 什么时候愿意支持与 scipy 兼容的版本?
Julien
原因是某些 Linux 包管理器不支持最新的 numpy scipy
个人希望 scikit-learn 遵循 SPEC 0
请参阅关于
1.3
的讨论
专用 RFC
scikit-learn 的某些行为取决于 SciPy 的版本(例如,请参阅
此示例
);我们可能会针对稀疏数组的支持(例如,重塑输出)依赖于类似的机制。
scikit-learn 使用 nightly 构建来测试 SciPy 和 NumPy 的开发人员版本,并且失败的测试会在
此问题
中更新。当我们在 SciPy 中进行更改时,我们可以观察这些更改以查看 scikit-learn 中是否出现故障。
通用加速
“规范的快速路径”
待办事项 (Isaac)
确定所有格式的规范,可能需要规范化 API
为构造函数添加关键字公开参数
弃用的总体计划
#
在我们可以使用 sparse_arrays 的所有地方添加支持
创建函数:目标版本 1.12
1d COO:目标版本 1.12
弃用特定于 spmatrix 的函数(如果存在简单的替换)
目标版本:1.12
一旦所有内容都可以使用稀疏数组,则弃用 spmatrix
并且稀疏数组 API 稳定!(具体来说,1d 支持)
目标版本:1.13
可操作项目
#
[Julien] 在文档中添加一个部分,解释语义更改以及弃用周期中下游库的迁移计划。
[Julien] 在 scikit-learn 中删除
isspmatrix_-
检查,并使用
issparse
和
format
下次会议日期和时间
#
每两周举行一次,可以选择每隔一次会议放弃一次(至少每月一次)
[name=Julien] +1。我建议每两周在同一时段开会 1 小时
在此页面上