Redmine の CI を安定化させるためにやったこと

Dec 19, 2024

これは Redmine Advent Calendar 2024 の19日目の記事です。

今年の 3月から Redmine の開発に携わるようになりましたが、実は Redmine を触ったのは 3.x 系以来で、実に9年ぶりでした。そんな中でも、この9ヶ月で redmine.org に20ほどのパッチを投稿しました。

投稿したチケットの数 = 20
取り込まれたチケットの数 = 19
Patch = 11, Defect = 8, Feature = 1

このうち、半分のチケットは CI またはテスト関連の改善です。

というわけで、今回は Redmine の CI を安定化させるために取り組んだことについて書きたいと思います。

ひたすら落ちているテストを直す

まずは、とにかく CI の結果を確認して、落ちているテストを直しました。

ほとんどがランダムで落ちるテストで、その原因は次の2つに分類できます。

ソート順が保証されていない
テストデータが不足している

#41901 Fix random test failure in DestroyProjectsJobTest due to unsorted `@projects`

https://www.redmine.org/issues/41901

ソート順が保証されていないケースの一つですが、比較的わかりやすいケースです。

--- a/test/unit/jobs/destroy_projects_job_test.rb
+++ b/test/unit/jobs/destroy_projects_job_test.rb
@@ -23,7 +23,7 @@ class DestroyProjectsJobTest < ActiveJob::TestCase
   fixtures :users, :projects, :email_addresses

   setup do
-    @projects = Project.where(id: [1, 2]).to_a
+    @projects = Project.where(id: [1, 2]).order(:id).to_a
     @user = User.find_by_admin true
     ActionMailer::Base.deliveries.clear
   end

失敗するテストコードはこちら。

test "schedule should enqueue job" do
  assert_enqueued_with(
    job: DestroyProjectsJob,
    args: [[1, 2], @user.id, '127.0.0.1']
  ) do
    @user.remote_ip = '127.0.0.1'
    DestroyProjectsJob.schedule @projects, user: @user
  end
end

DestroyProjectsJob.schedule() は、引数の @projects の id を取り出してジョブ引数に渡すので、 @projects をセットするときのクエリ条件の [1, 2] を期待値としています。一見問題なさそうですが、 @projects 自体のソート順が保証されていないためにランダムで失敗します。

#41931 Fix random failures in IssueRelationTest#test_create_with_initialized_journals due to ambiguous conditions for retrieving the expected detail

https://www.redmine.org/issues/41931

これもソート順が関係しているものですが、原因の特定にとても苦労しました。このチケットを投稿した時間が 2:41 であることからもわかります。

失敗するテストのコードはこちら。

assert_equal 'relation', to.journals.last.details.last.property

to.journals.last.details の結果には3つのデータが含まれ、かつソート順が保証されていないためにテストが失敗します。

対象の fixtures のファイルを blame すると、当初は details は1つのデータしか持たなかったようです。しかし、その後テストデータの変更によって details は3つのデータを持つようになり、ランダムで失敗するようになってしまいました。

#41623 Fix tests that randomly failed due to required fixtures not being loaded

https://www.redmine.org/issues/41623

必要な fixtures が宣言されていないために、テストデータが足りず、ランダムで失敗するいくつかのテストを修正したチケットです。必ず失敗するのではなく、ランダムで失敗する理由は後で説明します。

少し前までの Redmine のテストでは、以下のように失敗するテストは、大抵が fixtures の不足によるものでした。しかも、それらを直しても中々減らない。そういう状況でした。

Failure:
ChangesetTest#test_ref_keywords_any [test/unit/changeset_test.rb:53]:
Expected: 3
  Actual: 2

bin/rails test test/unit/changeset_test.rb:39

このチケットのパッチでやっていることは単純ですが、中には、テストデータが不足しているために内部的にバリデーションで失敗し、結果テストが失敗するケースもありました。バリデーションの失敗は握りつぶされているため、特定には時間がかかりました。

From: /redmine/app/models/changeset.rb @ line 260 :

    255: Redmine::Hook.call_hook(:model_changeset_scan_commit_for_issue_ids_pre_issue_update,
    256:                             {:changeset => self, :issue => issue, :action => action})
    257:
    258:     if issue.changes.any?
    259:       unless issue.save
 => 260:         binding.irb
    261:         logger.warn("Issue ##{issue.id} could not be saved by changeset #{id}: #{issue.errors.full_messages}") if logger
    262:       end
    263:     else
    264:       issue.clear_journal
    265:     end

irb(#<Changeset:0x000073145f1036a0>):001> issue.id
=> 2
irb(#<Changeset:0x000073145f1036a0>):002> issue.errors.full_messages
=> ["Target version is not included in the list"]

常に全ての fixture をロードするように変更

#41961 Use fixtures :all to ensure consistent test data and improve test reliability

少し前までの Redmine のテストでは、テストファイルごとに必要なテストデータを宣言していました。

class UserTest < ActiveSupport::TestCase
  fixtures :users, :email_addresses, :members, :projects, :roles, :member_roles, :auth_sources, (snip)

この fixtures の宣言が一つでも不足していると、テストはランダムで失敗します。

なぜランダムなのか。例えば、以下の２つのテストを用意します。

# test/unit/a_test.rb
class ATest < ActiveSupport::TestCase
  fixtures :users

  test "A test" do
    puts "-- A test"
    assert User.exists?(1)
  end
end

# test/unit/b_test.rb
class BTest < ActiveSupport::TestCase
  test "B test" do
    puts "-- B test"
    assert User.exists?(1)
  end
end

このとき、BTest の結果は、テストの実行順序によって変わります。

A test -> B test: BTest は成功する
B test -> A test: BTest は失敗する

これがランダムで失敗する原因です。テストの実行順序の組み合わせは無数にあるため、テストを直しても直しても減らなかったというわけです。

この解決として、テストファイルごとに必要な fixtures を個別に宣言することをやめ、全てのテストで fixtures :all を宣言して常に全てのテストデータをロードするように変更しました。

その後は fixtures の不足によってテストがランダムに失敗することは起こっていないようです。

また、これによって、テストに必要な fixtures を調べて宣言する必要もなくなりました。

最後に

fixtures :all によってテストが安定したおかげで、テストの並列化を導入しやすくなりました。 Rails 標準の pararellize を使うことで、GitHub CI の実行時間を10分から5分に短縮できることも検証済みです。

システムテストの導入と合わせて、今後も CI の改善に取り組んでいきたいと思います。

CIとテストの改善チケットまとめ

#41096 "##" syntax auto complete does not work
#41961 Use fixtures :all to ensure consistent test data and improve test reliability
#41969 Add SQLite3 tests to CI
#41931 Fix random failures in IssueRelationTest#test_create_with_initialized_journals due to ambiguous conditions for retrieving the expected detail
#41902 Fix class name to match file name in keyboard_shortcuts_test.rb
#41901 Fix random test failure in DestroyProjectsJobTest due to unsorted @projects
#41623 Fix tests that randomly failed due to required fixtures not being loaded
#41238 Fix test failure in IssuesSystemTest due to incorrect attachment count expectation