Shared: Prefer source/sink models with manual provenance over generated #21020

hvitved · 2025-12-12T08:57:38Z

I noticed on https://github.com/github/codeql/pull/20879/changes#diff-2dc9c76255b29ca51e9fe9d8861fe51534f0d72c032a32dbb2f554cbb7ffdf55 that we got some duplicate flow paths, which happens because std::fs::read has both a manual model and an auto-generated model. The fix is to always prioritize manual source/sink models over generated models, just like we do for flow summaries.

This PR also filters away generated flow summaries when there is a static target in source code for Rust, similar to C# and Java.

Copilot

Pull request overview

This PR addresses duplicate flow paths in dataflow analysis by prioritizing manual source/sink models over auto-generated models, and filtering away generated flow summaries when a static call target exists in source code for Rust.

Key Changes:

Introduced filtering logic to prefer manual models over generated models for sources and sinks
Added similar filtering for Rust flow summaries to match existing C# and Java behavior
Corrected a minor comment formatting issue in Java

Reviewed changes

Copilot reviewed 7 out of 7 changed files in this pull request and generated no comments.

Show a summary per file

File	Description
shared/dataflow/codeql/dataflow/internal/FlowSummaryImpl.qll	Added `isRelevantSource` and `isRelevantSink` predicates to filter generated models when manual models exist for the same kind
rust/ql/lib/codeql/rust/dataflow/internal/DataFlowImpl.qll	Added logic to exclude generated flow summaries when static call target is in source code, aligning with Java/C# behavior
java/ql/lib/semmle/code/java/dataflow/internal/DataFlowDispatch.qll	Added backticks around `applyGeneratedModel` in comment for consistency
rust/ql/test/query-tests/security/CWE-825/AccessInvalidPointer.expected	Removed duplicate flow path results as expected
rust/ql/test/query-tests/security/CWE-312/CleartextLogging.expected	Removed duplicate flow path results and renumbered model references
rust/ql/test/library-tests/dataflow/sources/file/TaintSources.expected	Removed duplicate source detections
rust/ql/test/library-tests/dataflow/sources/file/InlineFlow.expected	Removed duplicate flow edges and model references, renumbered remaining ones

💡 Add Copilot custom instructions for smarter, more guided reviews. Learn how to get started.

paldepind

Thanks. Nice to get this right.

github-actions bot added Java Rust Pull requests that update Rust code DataFlow Library labels Dec 12, 2025

hvitved force-pushed the shared/source-sink-provenance-prio branch from 4d27a73 to e393034 Compare December 12, 2025 09:37

hvitved added 3 commits December 12, 2025 11:16

Shared: Prefer source/sink models with manual provenance over generated

c4a8e9d

Rust: Apply same filtering of generated summaries as in C# and Java

0b81d44

Rust: Update expected test output

0b00589

hvitved force-pushed the shared/source-sink-provenance-prio branch from e393034 to 0b00589 Compare December 12, 2025 10:16

hvitved added the no-change-note-required This PR does not need a change note label Dec 12, 2025

hvitved marked this pull request as ready for review December 12, 2025 10:40

hvitved requested a review from a team as a code owner December 12, 2025 10:40

Copilot AI review requested due to automatic review settings December 12, 2025 10:40

hvitved requested review from a team as code owners December 12, 2025 10:40

Copilot started reviewing on behalf of hvitved December 12, 2025 10:41 View session

Copilot AI reviewed Dec 12, 2025

View reviewed changes

paldepind approved these changes Dec 12, 2025

View reviewed changes

aschackmull approved these changes Dec 12, 2025

View reviewed changes

hvitved merged commit b61a439 into github:main Dec 12, 2025
55 checks passed

hvitved deleted the shared/source-sink-provenance-prio branch December 12, 2025 15:01

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Shared: Prefer source/sink models with manual provenance over generated #21020

Shared: Prefer source/sink models with manual provenance over generated #21020

hvitved commented Dec 12, 2025 •

edited

Loading

Uh oh!

Copilot AI left a comment

Uh oh!

paldepind left a comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Shared: Prefer source/sink models with manual provenance over generated #21020

Shared: Prefer source/sink models with manual provenance over generated #21020

Conversation

hvitved commented Dec 12, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Copilot AI left a comment

Choose a reason for hiding this comment

Pull request overview

Reviewed changes

Uh oh!

paldepind left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

hvitved commented Dec 12, 2025 •

edited

Loading