峰会后续 6 月 17 日

2023 年 6 月 17 日星期五,UTC 时间 14:00 至 15:00#

与会者#

  • Dan
  • Erik
  • Isaac
  • CJ
  • Julien

议程#

  • 整理并分配待办事项
  • 类似数组的稀疏数组的路线图/计划
    • 矩阵的弃用计划
    • 创建例程
    • 与其他稀疏矩阵包的互操作性 (Isaac)
  • 博客文章

笔记#

  • 介绍,Erik 从事使用稀疏数据结构的库开发

待办事项#

  • 我们如何工作
    • [Dan] 进行中的工作放在哪里
      • CJ 的分支,在该分支上创建 PR
      • 使用 GitHub 上的差异视图可以防止创建虚假的草稿 PR
    • 伪装成稀疏的稠密数据可以是短暂的,不需要进入 scipy
    • Dan 将创建一个用于探索的分支,人们可以 fork 并向其发送 PR。Dan 还将尝试使其与主分支保持最新。
  • 1d 稀疏数组支持时间线?- Dan 和 CJ 正在处理 - 目标版本 1.12
  • nd 稀疏数组支持
    • Julien、CJ:这似乎优先级较低,并且对于相对少见的用例而言,这将给 SciPy 带来巨大的维护成本
    • CJ:数组 API 使互操作更容易,我们可以暂时依赖外部包
  • 创建函数 scipy#18592
    • 希望在单个版本中发布它们
    • Ross 会实现这些功能吗,还是需要分配给其他人?
    • 当前计划:_array 方法,因此我们可以将其应用于相同类型的 fast_matrix_market io
    • 捆绑 API 更改(例如形状的元组)
  • 弃用 isspmatrix_ 方法?
    • 听起来像是类 + 格式属性的组合涵盖了这一点
    • (Julien) 弃用计划:已建议使用代码替换这些内容
    • 在文档中添加一个部分,解释语义更改以及弃用周期中下游库的迁移计划。
      • 为数组 API 创建路线图
  • scikit-learn
    • scikit-learn 什么时候愿意支持与 scipy 兼容的版本?
      • Julien
        • 原因是某些 Linux 包管理器不支持最新的 numpy scipy
        • 个人希望 scikit-learn 遵循 SPEC 0
        • 请参阅关于1.3的讨论
        • 专用 RFC
        • scikit-learn 的某些行为取决于 SciPy 的版本(例如,请参阅此示例);我们可能会针对稀疏数组的支持(例如,重塑输出)依赖于类似的机制。
        • scikit-learn 使用 nightly 构建来测试 SciPy 和 NumPy 的开发人员版本,并且失败的测试会在此问题中更新。当我们在 SciPy 中进行更改时,我们可以观察这些更改以查看 scikit-learn 中是否出现故障。
  • 通用加速
    • “规范的快速路径”
      • 待办事项 (Isaac)
        • 确定所有格式的规范,可能需要规范化 API
        • 为构造函数添加关键字公开参数

弃用的总体计划#

  • 在我们可以使用 sparse_arrays 的所有地方添加支持
    • 创建函数:目标版本 1.12
    • 1d COO:目标版本 1.12
  • 弃用特定于 spmatrix 的函数(如果存在简单的替换)
    • 目标版本:1.12
  • 一旦所有内容都可以使用稀疏数组,则弃用 spmatrix
    • 并且稀疏数组 API 稳定!(具体来说,1d 支持)
    • 目标版本:1.13

可操作项目#

  • [Julien] 在文档中添加一个部分,解释语义更改以及弃用周期中下游库的迁移计划。
  • [Julien] 在 scikit-learn 中删除 isspmatrix_- 检查,并使用 issparseformat

下次会议日期和时间#

  • 每两周举行一次,可以选择每隔一次会议放弃一次(至少每月一次)

    [name=Julien] +1。我建议每两周在同一时段开会 1 小时

在此页面上