Manipuler des entités EF sans les charger

Publié le 31 August 2016

Lorsque l’on utilise Entity Framework sans connaître son fonctionnement, on peut très vite se retrouver dans la situation où l’on génère du SQL non performant. L’une des erreurs que l’on rencontre le plus souvent consiste à récupérer trop d’entités. On va voir dans cet article comment on peut optimiser nos traitements SQL en évitant de charger inutilement ces entités.

Mettre à jour une entité

Le premier cas que je rencontre concerne la mise à jour d’une entité. Le réflexe est d’avoir le code suivant :

var post = await context.Posts.FirstOrDefaultAsync(p => p.Id == id);

if(post == null) 
{
    throw new NotFoundException();
}

post.Title = newTitle;
post.Content = newContent;
post.Url = newUrl;

await context.SaveChangesAsync();

Ce code va déclencher les requêtes SQL suivantes :

SELECT [...] FROM Posts Where Id = @id

UPDATE Posts
SET Title = @title, Content = @content, Url = @url
WHERE Id = @Id

La première requête est inutile. On récupère des données qui ne seront pas utilisés pour l’UPDATE.

Pour optimiser le code SQL généré, l’idée est de jouer avec le contexte d’Entity Framework pour lui faire croire que l’entité a été chargée puis d’effectuer les modifications.

var post = new Post { Id = id };

context.Entry(post).State = EntityState.Unchanged;

post.Title = newTitle;
post.Content = newContent;
post.Url = newUrl;

await context.SaveChangesAsync();

L’instruction context.Entry permet d’attacher l’entité Post dans le contexte EF. De cette façon, Entity Framework pensera que l’entité a été chargée et il trackera tous les changements effectués. Le code précédent génèrera uniquement une requête SQL d’Update.

Pour que ce code fonctionne en toute circonstance, il est nécessaire de vérifier que l’entité n’est déjà attachée au contexte. En effet, si on essaye d’attacher l’entité alors qu’elle existe déjà, Entity Framework lancera une exception de type InvalidOperationException avec un message du type Attaching an entity of type ‘***’ failed because another entity of the same type already has the same primary key value. Pour solidifier le code précédent, il faudrait rajouter la vérification suivante :

var post = context.Set<Post>().Local.FirstOrDefault(p => p.Id == id);
if (post == null)
{
    post = new Post { Id = id };
    context.Entry(post).State = EntityState.Unchanged;
}

Mettre à jour des relations

Dans la même idée, je vois souvent du code qui ressemble à :

var post = await context.Posts.FirstOrDefaultAsync(p => p.Id == postId);
var category = await context.Categories.FirstOrDefaultAsync(c => c.Id == categoryId);

if(post == null || category == null) 
{
    throw new NotFoundException();
}

post.Categories.Add(category);

await context.SaveChangesAsync();

Pour lier une catégorie à un article, on va récupérer l’article, puis la catégorie pour enfin ajouter la relation. Ce code génèrera les requêtes SQL suivantes :

SELECT [...] FROM Posts Where Id = @postId

SELECT [...] FROM Categories Where Id = @categoryId

INSERT INTO PostCategories(PostId, CategoryId) VALUES (@postId, @categoryId)

Comme pour l’exemple précédent, on pourrait se passer des deux premières requêtes. Voici le code optimisé :

var post = new Post { Id = postId };
var category = new Category { Id = categoryId };

context.Entry(post).State = EntityState.Unchanged;
context.Entry(category).State = EntityState.Unchanged;

post.Categories.Add(category);

await context.SaveChangesAsync();

Là encore, on utilise la méthode context.Entry pour attacher au contexte nos deux entités. Ensuite, on ajoute simplement la relation et le SQL généré ne contient plus que la requête INSERT.

En attachant manuellement des entités sur le contexte, on peut assez facilement optimiser le code SQL généré.

Bon requêtage !

Manipuler des entités EF sans les charger

Mettre à jour une entité

Mettre à jour des relations

Si cet article t'a plu, n'hésites pas à partager sur Twitter, et si tu as des questions / remarques, n'hésites pas à me contacter sur Twitter